首页 > 代码库 > Python 3中bytes和str的分别

Python 3中bytes和str的分别

最近把一段py2的代码转换到py3的代码,结果运行到向socket中写数据的代码部分出现了‘str‘ does not support the buffer interface这样一个错误.

一番搜索之后,发现py3里是严格区分了str和bytes的.怎么理解str和bytes呢?你可以认为str是一段文本,比如“abcd#%$^*&”什么的,而bytes呢,是二进制的一堆0,1的比特而已.看下面的图:

可以看到str的类型是class ‘str‘,而str.encode()以后类型是class ‘bytes‘,这二者是不同的.而str.encode(‘gbk’)和str.encode(‘utf-8‘)得到的bytes的表示也是不同的.也就是说在采用不同的编码时,对同样的文本“哈哈”而言,其在内存中的那一堆01是不一样的.

str和bytes之间可以通过encode(),decode()相互转化.

下面是Python34\Lib\socket.py中的一段代码,可以看到在py3中,向一个socket file中写数据必须写的是bytes或是bytearray类型的

 1    def write(self, b): 2         """Write the given bytes or bytearray object *b* to the socket 3         and return the number of bytes written.  This can be less than 4         len(b) if not all data could be written.  If the socket is 5         non-blocking and no bytes could be written None is returned. 6         """ 7         self._checkClosed() 8         self._checkWritable() 9         try:10             return self._sock.send(b)11         except error as e:12             # XXX what about EINTR?13             if e.args[0] in _blocking_errnos:14                 return None15             raise

所以在send(content)的时候如果content类型不是bytes或bytearray而是str的话就会出现‘str‘ does not support the buffer interface的问题.将send(content)修正为send(content.encode())就好啦.

 

Python 3中bytes和str的分别