Python写过处理文本的,经常会遇到解码或者编码的需求,尤其是处理中文的时候。编码问题是个脏活累活,报错不好理解,网上相关资料也不好查。同样的感觉?请继续阅读。通常的做法是读取文件时立即解码,所有处理工作使用unicode,写入文件时编码。但是在阅读的时候,处理后的代码读/写起来很别扭,感觉穿鞋后袜子滑落了……Python3.1.1+解决了这个问题。在Python3.1.1中,你可以添加编码参数来打开一个文件:file=open(filename,encoding='xxx'),这样看起来终于舒服了。不同的是写如下代码file=open(filename)forlineinfile:decoded_line=line.decode('xxx')dosomethingelse提倡使用utf8
