首页 > 代码库 > 字符编码
字符编码
简单记录一下字符编码的中国发展历程:
ASCII——一个字符占一个字节、8位,有256个码位,可以表示256个字符
GB2312——可以表示682个字符,6763个汉字
GBK——23940个码位
GB18030——两万七千多码位
Unicode——一个字符占两个字节
UTF-8——原来ASCII所表示的字符不动,别的语言字符所占字节可伸长
Python2版本用的是ASCII码,所以是不支持中文的,所以在Python2中写程序时在开头要加上# -*- coding: utf-8 -*-,告诉Python解释器别用ASCII处理,用UTF-8处理
在Python3版本中用的是UTF-8,支持中文
字符编码问题详细见一篇文章:《中文化和国际化问题权威解析之一 字符编码发展历程》
字符编码
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。