首页 > 代码库 > CultureInfo中重要的InvariantCulture(转)

CultureInfo中重要的InvariantCulture(转)

CultureInfo简述

CultureInfo类位于System.Globalization命名空间内,这个类和这个命名空间许多人都不了解也认为不需要太多了解,实际上,你写的程序中会经常间接得使用这些类。

简单的说:当进行数字,日期时间,字符串匹配时,都会进行CultureInfo的操作,也就是不同的CultureInfo下,这些操作的结果可能会不一样。这里要介绍一下非常容易被忽视的InvariantCulture。

 

通过示例了解InvariantCulture

前面提到过,不同的CultureInfo会影响某些函数的执行结果,.NET中有一个特殊的CultureInfo:InvariantCulture,这个CultureInfo有点像英语格式,但它不和国家地区挂钩,它可以提供一个可靠的在多语言环境下的规范格式化。

比如你编写一个程序,要向数据中心服务器传递一些时间数据,你会怎么写?直接DateTime.ToString()?那你就大错特错了,下面用代码,举个非常形象的例子。在一个控制台里,模拟数据中心,然后放出多个线程,模拟客户端程序传递数据。

  1. static readonly string[] CultureSources = { "en-us", "zh-cn", "ar-iq", "de-de" };  
  2.   
  3.        static readonly Random Ran = new Random(Environment.TickCount);  
  4.   
  5.        static void Main()  
  6.   
  7.        {  
  8.   
  9.            Console.WriteLine("数据中心开始接受客户端数据:");  
  10.   
  11.            for (int i = 0; i CultureSources.Length; i++)  
  12.   
  13.                ThreadPool.QueueUserWorkItem(Client, i);  
  14.   
  15.            Console.ReadKey(true);  
  16.   
  17.   
  18.   
  19.            Console.WriteLine("");  
  20.   
  21.            Console.WriteLine("数据中心:…………");  
  22.   
  23.        }  
  24.   
  25.   
  26.   
  27.        static void Client(object obj)  
  28.   
  29.        {  
  30.   
  31.            int id = (int)obj;  
  32.   
  33.            Thread.Sleep(Ran.Next(1000));  
  34.   
  35.   
  36.   
  37.            CultureInfo cul = CultureInfo.GetCultureInfo(CultureSources[id]);  
  38.   
  39.            Thread.CurrentThread.CurrentCulture = cul;  
  40.   
  41.            Console.WriteLine("某客户端操作系统语言设置{0}\n传送数据:{1}\n", cul.DisplayName, new DateTime(1990, 10, 27).ToShortDateString());  
  42.   
  43.        }  

 

运行结果:

技术分享

结果看到了吧,同样的DateTime.ToShortDateString(),在英语-美国,中文-中国,阿拉伯语-伊拉克和德语-德国的不同环境下,1990年10月27日竟然有如此不同的输出结果,这些数据让数据中心服务器情何以堪啊……

原因则已提到过,在进行日期时间输出时,.NET会考虑当前线程的CultureInfo,即Thread.CurrentThread.CurrentCulture(或者CultureInfo.CurrentCulture),并根据CultureInfo,进行相应地区文化的数据处理。注意不要和UICulture混淆。

解决方案就是使用这个特殊的InvariantCulture。

把输出代码改成

  1. Console.WriteLine("某客户端操作系统语言设置{0}\n传送数据:{1}\n", cul.DisplayName,  
  2.   
  3.                 new DateTime(1990, 10, 27).ToString(  
  4.   
  5.                 CultureInfo.InvariantCulture.DateTimeFormat.ShortDatePattern, CultureInfo.InvariantCulture));  

 

这样不管客户端运行在什么语言环境下,输出的时间格式都是统一的,方面数据中心服务器对数据做后续处理。

(当然这个例子仅用来演示InvariantCulture的用法,是否存在其他不妥处这里不做讨论)

 

 

InvariantCulture和字符串比较

下面代码进行四种字符串比较方法,分别是zh-cn, en-us文化,数值比较和InvariantCulture比较(全部是区分大小写)。

  1. static void Main()  
  2.   
  3.        {  
  4.   
  5.            string[] strs =  
  6.   
  7.            { "a", "A", "b", "B", "abc", "ab", "aB", "AB", "Ab", "aaa", "00", "0001", "002", "a4", "a9", "a33" };  
  8.   
  9.   
  10.   
  11.            Console.WriteLine("en-US");  
  12.   
  13.            Array.Sort<string>(strs, StringComparer.Create(CultureInfo.GetCultureInfo("en-us"), false));  
  14.   
  15.            Console.WriteLine(String.Join(" < ", strs));  
  16.   
  17.   
  18.   
  19.            Console.WriteLine("zh-CN");  
  20.   
  21.            Array.Sort<string>(strs, StringComparer.Create(CultureInfo.GetCultureInfo("zh-CN"), false));  
  22.   
  23.            Console.WriteLine(String.Join(" < ", strs));  
  24.   
  25.   
  26.   
  27.            Console.WriteLine("Ordinal");  
  28.   
  29.            Array.Sort<string>(strs, StringComparer.Ordinal);  
  30.   
  31.            Console.WriteLine(String.Join(" < ", strs));  
  32.   
  33.   
  34.   
  35.            Console.WriteLine("Invariant");  
  36.   
  37.            Array.Sort<string>(strs, StringComparer.InvariantCulture);  
  38.   
  39.            Console.WriteLine(String.Join(" < ", strs));  
  40.   
  41.        }  

结果:

  1. en-US  
  2.   
  3. 00 0001 002 a33 a4 a9 aaa ab aB Ab AB abc B  
  4.   
  5. zh-CN  
  6.   
  7. 00 0001 002 a33 a4 a9 aaa ab aB Ab AB abc B  
  8.   
  9. Ordinal  
  10.   
  11. 00 0001 002 AB Ab a33 a4 a9 aB aaa ab abc b  
  12.   
  13. Invariant  
  14.   
  15. 00 0001 002 a33 a4 a9 aaa ab aB Ab AB abc B  
  16.   
  17.    

(下面全部是区分大小写)

Ordinal是传统比较方式,即比较每个字符的数值,如果相等的话,继续比较下一组,如果有一个没有的话,长度大的算大。

 Invariant和大多数CultureInfo都用一种更人性化的比较方法。首先判断一组字符是否是不一样(这里不区分大小写),直接返回结果如果不一样,因此b>AB,B>abc。如果一样的话比较下一组,如果都一样则比较长度,所以abc>AB>ab,如果长度都一样最后再比较大小写,另外一个字符大写永远大于小写,所以AB>Ab>aB>ab 

 

那么InvariantCulture这样比较字符串有什么作用呢?我觉得这样输出形式可读性更高,其实InvariantCulture比较字符串就是先进行一次不区分大小写的Ordinal比较(不过这里大写字母>小写字母),如果结果不相同的话在进行一遍区分大小写的Ordinal比较(同样这里也是大写字母>小写字母)。这样可以将字符串先进行一次大的筛选,然后再比较细节,看下面的示例,Ordinal和InvariantCulture的比较结果可读性更高!

  1. string[] arr = { "Ab", "aB", "AB", "ab", "Abccccccc", "aBccccc", "Abd" };  
  2.   
  3.    
  4.   
  5.             Array.Sort<string>(arr, StringComparer.Ordinal);  
  6.   
  7.             Console.WriteLine(String.Join("\n", arr));  
  8.   
  9.    
  10.   
  11.             Console.WriteLine();  
  12.   
  13.             Array.Sort<string>(arr, StringComparer.InvariantCulture);  
  14.   
  15.             Console.WriteLine(String.Join("\n", arr));  

结果:

技术分享

 

结果显而易见,Ordinal机器式的纯数值比较,上面的Ordinal排序结果看起来还是很乱,而InvariantCulture则可读性更高。

 

总结

支持多种CultureInfo是整个.NET Framework更加人性化,因为这可以使同一个数据适应不同地区和文化,这样当然满足处于不同地区和文化的用户,但前提是数据给“人”看,如果这些数据用于计算机之间的传输,即给“机器”看,这样的多文化处理反而不妥,造成同一个数据的不同展现形式,尤其是读写两方的文化地区不同时,数据可能根本无法被正常读取或者产生潜在bug,因此这里,正是InvariantCulture的用武之地

CultureInfo中重要的InvariantCulture(转)