首页 > 代码库 > 难分难解的字符集ASCII、Unicode、UTF-8 ---- 如果你也感到困惑,赶紧来围观
难分难解的字符集ASCII、Unicode、UTF-8 ---- 如果你也感到困惑,赶紧来围观
闲来无事学习一下Python,在看到关于Python字符类型的时候有提到字符集,字符集的问题我一直没搞明白,ASCII、Unicode、UTF-8之间有什么区别呢?借着这个机会总算是有了一点点的明白,记录下来,学习一下。
谈到字符集的人,肯定是跟计算机打交道的人,由于计算机只能处理数字,没有人类这么超高的智慧,如果计算机需要处理文本,那就必须把文本转换成数字。那么问题来了:如何实现把文本转换成数字这个过程呢?聪明的人类想到了字符集。最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),也就是说8位一个字节。所以,一个字节能表示的最大的整数就是255(28-1,二进制数字1111 1111 = 十进制 255),如果要表示更大的数字,就必须采用更多的字节,比如两个字节表示的最大整数是65535(216-1).
由于计算机诞生于美国,因此最初只是把大小写英文字母、数字和一些符号编码到计算机,这个编码就是ASCII编码
,比如大写字母A的编码是65,小写字母z的编码是122。下面是ASCII编码表,^_^ :
原文地址: Read More >>
难分难解的字符集ASCII、Unicode、UTF-8 ---- 如果你也感到困惑,赶紧来围观
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。