首页 > 代码库 > python 字符串和编码
python 字符串和编码
ASCII编码:
计算机是美国人发明的,所以字符串只有数字,英文字母和特殊字符,一共有127个字符被编码在计算机里,这个编码表被称为ASCII编码。这种编码存储字符只用了一个byte即8bit.
Unicode(万国码,统一编码):
但要存储全世界的字符1byte是绝对不够的。这时unicode编码应运而生,最常用的是用2byte表示一个字符.
UTF-8编码:
使用Unicode虽然解决了乱码问题,但是如果文本都是英文,这样存储太浪费空间且传输时也很浪费带宽。所以为了解决这个问题UTF-8编码应运而生。这种方式是把Unicode编码转换成UTF-8编码。英文占用1byte,汉字占用3byte,很生僻的字才用4-6byte. 实际上ASCII码可以看作UTF-8的一部分。
python 字符串和编码
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。