首页 > 代码库 > 【java解惑】Unicode转义符的使用

【java解惑】Unicode转义符的使用


    如下所示代码:

public class Example014 {

	public static void main(String[] args) {
		/**
		 * it is a test for \utest.
		 */
		// \u0022 是双引 号的 Unicode 转义字符
		System.out.println("a\u0022.length() + \u0022b".length());
	}
}

    结果说明:

    上述程序有编译错误。如果删除多行注释,则编译错误消除,输出结果为2.

   

     结果分析:

    首先分析编译错误的原因,可以肯定编译错误是由多行注释引起的,它包含了一个\u开头的Unicode转义字符序列,但是却没有紧跟着4个16进制的数(0~65535),导致该转义失效。java是允许在注释以及代码中使用\u开头的Unicode转义字符的,但是要求转义必须有效,否则编译器会报告错误

    删除该段注释或者使该转义有效之后,执行上述代码得到的结果是2,又是为什么呢?原来,Java 对在字符串字面常量中的 Unicode 转义字符没有提供任何特殊处理。编译器在将程序解析成各种符号之前,先将Unicode转义字符转换成为它们所表示的字符。所以,程序中的第一个 Unicode转义字符将作为一个单字符字符串字面常量( "a")的结束引号,而第二个Unicode 转义字符将作为另一个单字符字符串字面常量( "b")的开始引号,该程序实际运行的代码如下:

System.out.println("a".length() + "b".length());

    这样来看,输出结果为2也就不足为奇了。




(注:本【java解惑】系列,均是博主阅读《java解惑》原书后,将原书上的讲解和例子部分改编,然后写成博文进行发布的。所有例子均亲自测试通过,并共享在github上。通过这些例子,激励自己,惠及他人。同时,本系列所有博文会同步发布在博主个人微信公众号(搜索“爱题猿”或者“ape_it”),方便大家阅读。如果文中有任何侵犯原作者权利的内容,请及时告知博主,以便及时删除;如果读者对文中的内容有异议或者问题,欢迎通过博客留言或者微信公众号留言等方式共同探讨。)

源代码地址:https://github.com/rocwinger/java-disabuse




本文出自 “winger” 博客,谢绝转载!

【java解惑】Unicode转义符的使用