java正则表达式中的POSIX 字符类和Unicode 块和类别的类介绍 - 程序员工具箱

2000万优秀解决方案库，覆盖所有编程及软件开发类，极速查询

今日已更新 1894 篇代码解决方案

首页 > 代码库 > java正则表达式中的POSIX 字符类和Unicode 块和类别的类介绍

java正则表达式中的POSIX 字符类和Unicode 块和类别的类介绍

2024-10-06 16:14:02 217人阅读

假如现在有一个需求，要你用Java语言来匹配出一个文本里面的所有（英文半角）标点符号，你会怎么写呢？我想大多数人应该是把这些符号都罗列出来，

如：

!"#$%&‘()*+,-./:;<=>?@[\]^_`{|}~

但[!"#$%&‘()*+,-./:;<=>?@[\]^_`{|}~]这样写需要转义一下，

结果为：

[-!"\#\$%&‘()*+,./:;<=>?@

\^_`\{\|\}~]

然后写到java代码后，有需要转义一次，

变为：

[-!\"\\#\\$%&‘()*+,./:;<=>?@\\[\\\\\\]\\^_`\\{\\|\\}~]

这样的代码，细思极恐。技术分享

我们先来用java代码验证一下，这个长长的正则能不能用

[java] view plain copy

print?

String str="1~2-6,C#,1+2=3;@qq.com2^3functon(){}";
String regex="[-!\"\\#\\$%&‘()*+,./:;<=>?@\\[\\\\\\]\\^_`\\{\\|\\}~]";
Matcher m=Pattern.compile(regex).matcher(str);
while(m.find()){
System.out.print(m.group());
}

输出结果：

~-,#,+=;@.^(){}

很欣慰，正则应该是没错的。但这样的正则看起来挺反胃的，那么有没有简洁的写法呢？答案是有的，可以利用POSIX字符类来实现，正则为：\p{Punct}

[java] view plain copy

print?

String str="1~2-6,C#,1+2=3;@qq.com2^3functon(){}";
String regex="\\p{Punct}";
Matcher m=Pattern.compile(regex).matcher(str);
while(m.find()){
System.out.print(m.group());
}

输出结果：

~-,#,+=;@.^(){}

简直了，是不是对正则又燃起了希望之火技术分享，这就是在恰当的时候用POSIX字符类的好处。虽然平时比较少运用POSIX字符类的写法，但在恰当的时机运用起来就会有一种一鸣惊人的感觉。

那么我们来看看POSIX字符类有哪些：

技术分享

除了POSIX字符类之外，还有一个也知道提一下，那就是Unicode块和类别的类

技术分享

java正则表达式中的POSIX 字符类和Unicode 块和类别的类介绍

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们