首页 > 代码库 > 【java解惑】Unicode转义符的使用
【java解惑】Unicode转义符的使用
如下所示代码:
public class Example014 { public static void main(String[] args) { /** * it is a test for \utest. */ // \u0022 是双引 号的 Unicode 转义字符 System.out.println("a\u0022.length() + \u0022b".length()); } }
结果说明:
上述程序有编译错误。如果删除多行注释,则编译错误消除,输出结果为2.
结果分析:
首先分析编译错误的原因,可以肯定编译错误是由多行注释引起的,它包含了一个\u开头的Unicode转义字符序列,但是却没有紧跟着4个16进制的数(0~65535),导致该转义失效。java是允许在注释以及代码中使用\u开头的Unicode转义字符的,但是要求转义必须有效,否则编译器会报告错误。
删除该段注释或者使该转义有效之后,执行上述代码得到的结果是2,又是为什么呢?原来,Java 对在字符串字面常量中的 Unicode 转义字符没有提供任何特殊处理。编译器在将程序解析成各种符号之前,先将Unicode转义字符转换成为它们所表示的字符。所以,程序中的第一个 Unicode转义字符将作为一个单字符字符串字面常量( "a")的结束引号,而第二个Unicode 转义字符将作为另一个单字符字符串字面常量( "b")的开始引号,该程序实际运行的代码如下:
System.out.println("a".length() + "b".length());
这样来看,输出结果为2也就不足为奇了。
(注:本【java解惑】系列,均是博主阅读《java解惑》原书后,将原书上的讲解和例子部分改编,然后写成博文进行发布的。所有例子均亲自测试通过,并共享在github上。通过这些例子,激励自己,惠及他人。同时,本系列所有博文会同步发布在博主个人微信公众号(搜索“爱题猿”或者“ape_it”),方便大家阅读。如果文中有任何侵犯原作者权利的内容,请及时告知博主,以便及时删除;如果读者对文中的内容有异议或者问题,欢迎通过博客留言或者微信公众号留言等方式共同探讨。)
源代码地址:https://github.com/rocwinger/java-disabuse
本文出自 “winger” 博客,谢绝转载!
【java解惑】Unicode转义符的使用