首页 > 代码库 > Python菜鸟晋级02----Python3的bytes与str

Python菜鸟晋级02----Python3的bytes与str

Python 3最重要的新特性大概要算是对文本二进制数据作了更为清晰的区分。

文本总是Unicode,由str类型表示,二进制数据则由bytes类型表示。Python 3不会以任意隐式的方式混用str和bytes,正是这使得两者的区分特别清晰。你不能拼接字符串和字节包,也无法在字节包里搜索字符串(反之亦然),也不能将字符串传入参数为字节包的函数(反之亦然)。这是件好事。



不管怎样,字符串和字节包之间的界线是必然的,下面的图解非常重要,务请牢记于心:

技术分享

字符串可以编码成字节包,而字节包可以解码成字符串。

>>> "你好".encode("utf-8")                            #encode将字符串变成字节
b'\xe4\xbd\xa0\xe5\xa5\xbd'
>>> b'\xe4\xbd\xa0\xe5\xa5\xbd'.decode('utf-8')       #decode将字节变成字符串
'你好'

当然编码也可以使用其他编码格式,例如GBK

>>> "你好".encode("GBK")
b'\xc4\xe3\xba\xc3'
>>> b'\xc4\xe3\xba\xc3'.decode("gbk")
'你好'
>>> 


上一讲:Python菜鸟晋级01----Python3.x和Python2.x的区别

下一讲:Python菜鸟晋级03----repr() 与str() 函数的区别

如果有什么疑问欢迎到我的微信公众号提问~
技术分享



Python菜鸟晋级02----Python3的bytes与str