首页 > 代码库 > GBK编码具体解析(附GBK码位分布图)
GBK编码具体解析(附GBK码位分布图)
1.GBK码位分布图
2.GBK码位说明
GBK 亦採用双字节表示,整体编码范围为 8140-FEFE,首字节在 81-FE 之间,尾字节在 40-FE 之间,剔除 xx7F 一条线。总计 23940 个码位,共收入 21886 个汉字和图形符号,当中汉字(包含部首和构件)21003 个,图形符号 883 个。所有编码分为三大部分:
1. 汉字区。
包含:
a. GB 2312 汉字区。即 GBK/2: B0A1-F7FE。收录 GB 2312 汉字 6763 个,按原顺序排列。
b. GB 13000.1 扩充汉字区。包含:
(1) GBK/3: 8140-A0FE。收录 GB 13000.1 中的 CJK 汉字 6080 个。
(2) GBK/4: AA40-FEA0。收录 CJK 汉字和增补的汉字 8160 个。CJK 汉字在前,按 UCS 代码大小排列;增补的汉字(包含部首和构件)在后,按《康熙字典》的页码/字位排列。
2. 图形符号区。
包含:
a. GB 2312 非汉字符号区。即 GBK/1: A1A1-A9FE。
当中除 GB 2312 的符号外,还有 10 个小写罗马数字和 GB 12345 增补的符号。计符号 717 个。
b. GB 13000.1 扩充非汉字区。
即 GBK/5: A840-A9A0。
BIG-5 非汉字符号、结构符和“○”排列在此区。计符号 166 个。
3. 用户自己定义区:分为(1)(2)(3)三个小区。
(1) AAA1-AFFE,码位 564 个。
(2) F8A1-FEFE,码位 658 个。
(3) A140-A7A0,码位 672 个。
第(3)区虽然对用户开放,但限制使用,由于不排除未来在此区域增补新字符的可能性。
參考资料:
url=Hi1z5qUwV8XPhunlRDVkgMuKdOassSy-S9MvCj8djumSeKNFVa7584Mo5kCNphWttbbNoSb7lta-S4dHbaKchaNVvNWxChGN3lbwlx6AuJq" style="background-color:inherit; font-family:微软雅黑; line-height:1.5">http://baike.baidu.com/link?url=Hi1z5qUwV8XPhunlRDVkgMuKdOassSy-S9MvCj8djumSeKNFVa7584Mo5kCNphWttbbNoSb7lta-S4dHbaKchaNVvNWxChGN3lbwlx6AuJq
GBK编码具体解析(附GBK码位分布图)
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。