首页 > 代码库 > 编码方式

编码方式

1.unicode只是一种编码方式。

 ASCII码:127个数字: 对应7个比特位————> 美国——占1个字  节

 扩展ASCII码:256个数字:8个比特位——————>拉丁——占1个字  节

 中文扩展ASCII码(GB2312): 几千个状态————>中国——占2个  字节

 中文扩展ASCII码(GBK):两万多个状态—————中国---占1个字  节

 Unicode(万国码):———六七万个字节———全世界----都是2个  字节

 UTF8(美国人伤不起,在万国码基础上改进成能伸能缩的编码方  式):

  英文1个字节,非英文考虑两个或三个,中国变成3个字节了!坑!

2.编码与解码。

我们向软件输入文字并保存的过程(编码过程):

其实是软件先将你的明文字符扔到内存,它是以unicode编码方式转成二进制扔到内存里的,而后不能以utf8编码方式的二进制写到硬盘上(因为utf8占空间),它在内存里再把unicode编码的二进制转成utf8编码方式的二进制数。

unico是:明文——>unico二进制——>utf8二进制——>磁盘

我们从硬盘里打开保存的文件(解码过程):

utf8它不能直接将二进制转化成明文,所以:

utf8二进制——>unicode二进制——>内存——>明文

 

编码方式