首页 > 代码库 > java正则表达式中的POSIX 字符类和Unicode 块和类别的类介绍
java正则表达式中的POSIX 字符类和Unicode 块和类别的类介绍
假如现在有一个需求,要你用Java语言来匹配出一个文本里面的所有(英文半角)标点符号,你会怎么写呢?我想大多数人应该是把这些符号都罗列出来,
如:
!"#$%&‘()*+,-./:;<=>?@[\]^_`{|}~
但[!"#$%&‘()*+,-./:;<=>?@[\]^_`{|}~]这样写需要转义一下,
结果为:
[-!"\#\$%&‘()*+,./:;<=>?@
\^_`\{\|\}~]
然后写到java代码后,有需要转义一次,
变为:
[-!\"\\#\\$%&‘()*+,./:;<=>?@\\[\\\\\\]\\^_`\\{\\|\\}~]
这样的代码,细思极恐。
我们先来用java代码验证一下,这个长长的正则能不能用
[java] view plain copy
print?
- String str="1~2-6,C#,1+2=3;@qq.com2^3functon(){}";
- String regex="[-!\"\\#\\$%&‘()*+,./:;<=>?@\\[\\\\\\]\\^_`\\{\\|\\}~]";
- Matcher m=Pattern.compile(regex).matcher(str);
- while(m.find()){
- System.out.print(m.group());
- }
输出结果:
~-,#,+=;@.^(){}
很欣慰,正则应该是没错的。但这样的正则看起来挺反胃的,那么有没有简洁的写法呢?答案是有的,可以利用POSIX字符类来实现,正则为:\p{Punct}
[java] view plain copy
print?
- String str="1~2-6,C#,1+2=3;@qq.com2^3functon(){}";
- String regex="\\p{Punct}";
- Matcher m=Pattern.compile(regex).matcher(str);
- while(m.find()){
- System.out.print(m.group());
- }
输出结果:
~-,#,+=;@.^(){}
简直了,是不是对正则又燃起了希望之火,这就是在恰当的时候用POSIX字符类的好处。虽然平时比较少运用POSIX字符类的写法,但在恰当的时机运用起来就会有一种一鸣惊人的感觉。
那么我们来看看POSIX字符类有哪些:
除了POSIX字符类之外,还有一个也知道提一下,那就是Unicode块和类别的类
java正则表达式中的POSIX 字符类和Unicode 块和类别的类介绍
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。