首页 > 代码库 > mysql5.1中utf8编码下一个汉字占用一个char的疑惑
mysql5.1中utf8编码下一个汉字占用一个char的疑惑
最近发现Oracle和MySQL的字段长度的计算不一样(都是UTF8编码),比如:
在Oracle下定义:name varchar2(10) ,name字段能存放:10个字符或3个汉字
在MySQL下定义:name varchar(10),name字段能存放:10个字符或10个汉字
从上面可以得知:在oracle下,1个汉字=3个字节
为什么在 MySQL 下,1个汉字=1个字节 呢??
经查,说:MySQL5 以后 varchar 的单位是字符了,而 oracle 的varchar2 是字节
编码不一样一个汉字占用的字节也不一样:
UTF-8 下 1汉字=3字节
GDK下 1汉字=2字节
mysql varchar(50),不管中文还是英文都是存50个的。
MySQL5的文档,其中对varchar字段类型这样描述:varchar(m) 变长字符串。M 表示最大列长度。M的范围是0到65,535。(VARCHAR的最大实际长度由最长的行的大小和使用的字符集确定,最大有效长度是65,532字节)。
为何会这般变换?真是感觉MySQL的手册做的太不友好了,因为你要仔细的继续往下读才会发现这段描述:MySQL 5.1遵从标准SQL规范,并且不删除VARCHAR值的尾部空格。VARCHAR保存时用一个字节或两个字节长的前缀+数据。如果VARCHAR列声明的长度大于255,长度前缀是两个字节。
好了,貌似懂了一点。但具体他说的长度大于255时使用2个字节长度前缀,小学减法题:65535 - 2 = 65533啊。不知道这些大牛如何计算的,暂且保留疑问吧?
注:我测试了一下使用UTF8编码,varchar的最大长度为21854字节。
在mysql 5.0.45版本,数据库编码utf8下进行测试:varchar最长定义为21785。也就是说不论字母、数字、汉字,只能放21785个。
在Oracle下定义:name varchar2(10) ,name字段能存放:10个字符或3个汉字
在MySQL下定义:name varchar(10),name字段能存放:10个字符或10个汉字
从上面可以得知:在oracle下,1个汉字=3个字节
为什么在 MySQL 下,1个汉字=1个字节 呢??
经查,说:MySQL5 以后 varchar 的单位是字符了,而 oracle 的varchar2 是字节
编码不一样一个汉字占用的字节也不一样:
UTF-8 下 1汉字=3字节
GDK下 1汉字=2字节
mysql varchar(50),不管中文还是英文都是存50个的。
MySQL5的文档,其中对varchar字段类型这样描述:varchar(m) 变长字符串。M 表示最大列长度。M的范围是0到65,535。(VARCHAR的最大实际长度由最长的行的大小和使用的字符集确定,最大有效长度是65,532字节)。
为何会这般变换?真是感觉MySQL的手册做的太不友好了,因为你要仔细的继续往下读才会发现这段描述:MySQL 5.1遵从标准SQL规范,并且不删除VARCHAR值的尾部空格。VARCHAR保存时用一个字节或两个字节长的前缀+数据。如果VARCHAR列声明的长度大于255,长度前缀是两个字节。
好了,貌似懂了一点。但具体他说的长度大于255时使用2个字节长度前缀,小学减法题:65535 - 2 = 65533啊。不知道这些大牛如何计算的,暂且保留疑问吧?
注:我测试了一下使用UTF8编码,varchar的最大长度为21854字节。
在mysql 5.0.45版本,数据库编码utf8下进行测试:varchar最长定义为21785。也就是说不论字母、数字、汉字,只能放21785个。
推想:varchar字节最大65535,utf8编码一个字符3个字节65535/3=21785。但是用length函数取值的时候发现,一个汉字占3个字节,一个字母等字符占用一个字节。这个对于char(10)来说,是不是实际长度是不定的呢?
参考链接:
http://www.oschina.net/question/59889_12699
http://zhidao.baidu.com/question/132054814
mysql5.1中utf8编码下一个汉字占用一个char的疑惑
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。