首页 > 代码库 > 字符编码
字符编码
1.unicode: 2或4字节
>>> print u‘\u4e2d‘ # 4e2d ,unicode
中
2.utf-8 : 1到6字节 ,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节,
ASCII编码实际上可以被看成是UTF-8编码的一部分
3.unicode--------> utf-8 : u‘中文‘.encode(‘utf-8‘)
utf-8--------> unicode :xxx.decode(‘utf-8‘)
unicode--------> gbk : u‘中文‘.encode(‘gb2312‘)
gbk--------> unicode : unicode(xxx,‘gb2312‘)
字符编码
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。