首页 > 代码库 > python实战之编码问题:中文!永远的痛

python实战之编码问题:中文!永远的痛

编码的思维图谱:

技术分享

技术分享

也就是说文件没有编码之说,事实上都是按二进制格式保存在硬盘中的。不过在写入读取时须使用相应的编码进行处理,以便操作系统配合相关软件/字体,绘制到屏幕中给人看。所以关键问题是得知道原先这些字串数据是使用什么编码来编译的!可是在 Unicode之前都是使用类似对比表的形式来组织编码的,无法从串数据流本身统一解出不同的文
字来。

unicode是编码方式,万国码,详细的实现方式:utf-8  utf-16

在逻辑上 unicode是没有编码格式的。

进行I/O输出一定要做encode(‘utf-8‘)这样类似的操作


只是unicode在python 是内部函数。

ust r i ng = uni code( st r eam , ‘ gbk‘ )这个的意思就是先转换成unicode,再转换成你想要的编码

技术分享

python实战之编码问题:中文!永远的痛