首页 > 代码库 > Python基础指北
Python基础指北
编码
Python的世界中内存中统一使用Unicode,使用时转换为其他编码,比如网页/文档编辑器
Python3中字符串类型 str 使用Unicode编码,而I/O得到的是字节码 byte,使用内建函数可以相互转换
(python中encode后得到的bytes如果不能用ascii呈现,比如中文encode成bytes,就会显示‘\x##‘)
为了在python中正确使用中文,应该在py文件中声明 # -*- coding: utf-8 -*-,同时在文本编辑器使用utf8进行编辑。
(如说你声称你讲中文,然后blabla讲了一堆韩语,对方的翻译器肯定是)(¥&!)(@*%S%……(@#%)
what‘s more:
关于Python中的Unicode
python2中有两种字符串类型
str:字节流
unicode:code point
到了python3,我们使用的类型变成了
str:code point
bytes:字节流
在python2中,不同类型的字符串会隐式转换,在python3中,不会隐式转换。
what to do:
1.在python内部使用unicode,在IO时与bytes转换,对于input的数据decode之,对于要ouput的数据encode之。
2.了解IO得到的bytes数据具体是哪一种encoding方式,是utf8、GBK,还是其它什么。
3.你从第2条得到的信息可能是错的,所以记得测试一下。
list/tuple
list.append(something)
list.insert(position, something)
list.pop([position])
Python基础指北