首页 > 代码库 > java 字符深入知识,待整理
java 字符深入知识,待整理
‘编‘,"编", 为什么获取到的字节数组长度不一样
http://www.cnblogs.com/yongdaimi/p/5899328.html
Unicode 官网
http://unicode.org/
utf-8 汉字对照表
http://blog.chinaunix.net/uid-25544300-id-3281847.html
提及内码与外码
https://www.zhihu.com/question/27562173
code unit 和 code point
http://www.jianshu.com/p/a7db6ac53d57
编码问题,写的很细,但是目前看不懂
http://www.fmddlmyy.cn/text6.html
Unicoce码又称为UCS
Unicode的学名是"Universal Multiple-Octet Coded Character Set",简称为UCS。UCS可以看作是"Unicode Character Set"的缩写。
UCS只是规定如何编码,并没有规定如何传输、保存这个编码。例如“汉”字的UCS编码是6C49,我可以用4个ascii数字来传输、保存这个编码;也可以用utf-8编码:3个连续的字节E6 B1 89来表示它。关键在于通信双方都要认可。UTF-8、UTF-7、UTF-16都是被广泛接受的方案。UTF-8的一个特别的好处是它与ISO-8859-1完全兼容。UTF是“UCS Transformation Format”的缩写。
java 字符深入知识,待整理
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。