首页 > 代码库 > sql server 汉字的长度

sql server 汉字的长度

  前几天改了人家程序中的一个小bug,就是输入时长度的校验问题。项目是.Net的,数据库是 sql server的。检查了一下,发现以前的人员把长度给控制小了,数据库中允许输入256的长度,而别人在asp程序中只定义了64.当时很急,我发现了这个问题之后,就想当然的的把64改成256.测测可以保存成功,应该可以了。后来头跟我说,256的长度应该没有考虑汉字吧,应该把长度定为128,免得输入256个汉字存到数据库中,把数据库给搞崩了。我们平时都是用ORACLE的,对sql server数据库不是很熟,我说没有啊,刚才我保存256汉字成功了,并且数据库中也存进去了啊。头说不会是自动截了多余的部分吧?我看看并没有这样,是会存进去。把长度改为257的时候,页面会崩掉。

      后来我又改了另外一个字段的属性,明明都是256,但是这个却不一样,这个只能输入256个英文字母,但是只能输入128个汉字。我看看这个字段的检验实在js中的,有一个lengthB()的方法,估计这个会是控制字节数的。

     后来我查了数据库中的定义,他们的属性都是nvarchar的,看了下面我在网上搜的资料就明白了。

       (1)char、varchar、text和nchar、nvarchar、ntext char和varchar的长度都在1到8000之间,它们的区别在于char是定长字符数据,而varchar是变长字符数据。所谓定长就是长度固定的,当输入的数据长度没有达到指定的长度时将自动以英文空格在其后面填充,使长度达到相应的长度;而变长字符数据则不会以空格填充。text存储可变长度的非Unicode数据,最大长度为2^31-1(2,147,483,647)个字符。

        后面三种数据类型和前面的相比,从名称上看只是多了个字母"n",它表示存储的是Unicode数据类型的字符。写过程序的朋友对Unicode应该很了解。字符中,英文字符只需要一个字节存储就足够了,但汉字众多,需要两个字节存储,英文与汉字同时存在时容易造成混乱,Unicode字符集就是为了解决字符集这种不兼容的问题而产生的,它所有的字符都用两个字节表示,即英文字符也是用两个字节表示。nchar、nvarchar的长度是在1到4000之间。和char、varchar比较:nchar、nvarchar则最多存储4000个字符,不论是英文还是汉字;而char、varchar最多能存储8000个英文,4000个汉字。可以看出使用nchar、nvarchar数据类型时不用担心输入的字符是英文还是汉字,较为方便,但在存储英文时数量上有些损失。

    (2)datetime和smalldatetime datetime:从1753年1月1日到9999年12月31日的日期和时间数据,精确到百分之三秒。 smalldatetime:从1900年1月1日到2079年6月6日的日期和时间数据,精确到分钟。

     (3)bitint、int、smallint、tinyint和bit bigint:从-2^63(-9223372036854775808)到2^63-1(9223372036854775807)的整型数据。 int:从-2^31(-2,147,483,648)到2^31-1(2,147,483,647)的整型数据。 smallint:从-2^15(-32,768)到2^15-1(32,767)的整数数据。 tinyint:从0到255的整数数据。 bit:1或0的整数数据。

    (4)decimal和numeric 这两种数据类型是等效的。都有两个参数:p(精度)和s(小数位数)。p指定小数点左边和右边可以存储的十进制数字的最大个数,p必须是从 1到38之间的值。s指定小数点右边可以存储的十进制数字的最大个数,s必须是从0到p之间的值,默认小数位数是0。

    (5)float和real float:从-1.79^308到1.79^308之间的浮点数字数据。 real:从-3.40^38到3.40^38之间的浮点数字数据。在SQL Server中,real的同义词为float(24)。