首页 > 代码库 > # coding:utf-8与sys.setdefaultencoding()的区别

# coding:utf-8与sys.setdefaultencoding()的区别

1,# coding:utf-8
设置文件内容的编码
2,sys.setdefaultencoding()
设置python解析器默认的编码

首先python编解码的过程是:

str.decode(‘str的编码‘) --> unicode
unicode.encode(‘想要的编码‘) --> 想要的编码

换句话说就是:unicode就是中间态编码,只用先将str字符串decode成unicode之后,才能将其encode成其他编码格式

例子: 

# coding:utf-8
  s = ‘中文字符‘  # s是str类型的,而不是unicode类型的
  s.encode(‘utf-8‘) # 这里对s直接encode,其实系统默认在中间做了一步转换,就是先对s进行decode,然后在进行encode。因为decode是系统自己默认进行的,所以使用的是系统默认的编码格式进行decode的,这里的系统默认编码就是可以通过sys.setdefaultencoding()设置的。

# coding:utf-8与sys.setdefaultencoding()的区别