首页 > 代码库 > Python基础指北

Python基础指北

编码


Python的世界中内存中统一使用Unicode,使用时转换为其他编码,比如网页/文档编辑器

技术分享

技术分享

 

Python3中字符串类型 str 使用Unicode编码,而I/O得到的是字节码 byte,使用内建函数可以相互转换

技术分享

(python中encode后得到的bytes如果不能用ascii呈现,比如中文encode成bytes,就会显示‘\x##‘)

为了在python中正确使用中文,应该在py文件中声明 # -*- coding: utf-8 -*-,同时在文本编辑器使用utf8进行编辑。

(如说你声称你讲中文,然后blabla讲了一堆韩语,对方的翻译器肯定是)(¥&!)(@*%S%……(@#%)

 

what‘s more:

关于Python中的Unicode

python2中有两种字符串类型

str:字节流

unicode:code point

到了python3,我们使用的类型变成了

str:code point

bytes:字节流

 在python2中,不同类型的字符串会隐式转换,在python3中,不会隐式转换。

 

what to do:
  1.在python内部使用unicode,在IO时与bytes转换,对于input的数据decode之,对于要ouput的数据encode之。

  2.了解IO得到的bytes数据具体是哪一种encoding方式,是utf8、GBK,还是其它什么。

  3.你从第2条得到的信息可能是错的,所以记得测试一下。

 

list/tuple


list.append(something)

list.insert(position, something)

list.pop([position])

 

Python基础指北