首页 > 代码库 > 编码方式
编码方式
一
1.unicode只是一种编码方式。
ASCII码:127个数字: 对应7个比特位————> 美国——占1个字 节
扩展ASCII码:256个数字:8个比特位——————>拉丁——占1个字 节
中文扩展ASCII码(GB2312): 几千个状态————>中国——占2个 字节
中文扩展ASCII码(GBK):两万多个状态—————中国---占1个字 节
Unicode(万国码):———六七万个字节———全世界----都是2个 字节
UTF8(美国人伤不起,在万国码基础上改进成能伸能缩的编码方 式):
英文1个字节,非英文考虑两个或三个,中国变成3个字节了!坑!
2.编码与解码。
我们向软件输入文字并保存的过程(编码过程):
其实是软件先将你的明文字符扔到内存,它是以unicode编码方式转成二进制扔到内存里的,而后不能以utf8编码方式的二进制写到硬盘上(因为utf8占空间),它在内存里再把unicode编码的二进制转成utf8编码方式的二进制数。
unico是:明文——>unico二进制——>utf8二进制——>磁盘
我们从硬盘里打开保存的文件(解码过程):
utf8它不能直接将二进制转化成明文,所以:
utf8二进制——>unicode二进制——>内存——>明文
编码方式
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。