在抓取网页或读取以前写的程序在存储非acsii码时, 经常会遇到得到的字符串变量如
a= "\u6469\u5c14\u5e84\u56ed"
可以用unicode('\u6469\u5c14\u5e84\u56ed','unicode-escape') 或者'\u6469\u5c14\u5e84\u56ed'.decode('unicode_escape') 来解决
的情况. 这种情况也不难,原来在python的语言转换中除指定编码外, 还有些其它应用的特殊格式.
具体见: http://docs.python.org/library/codecs.html#standard-encodings