首页 > 代码库 > java-正则表达式方法
java-正则表达式方法
Java正则表达式和Perl的是最为相似的。 java.util.regex包主要包括以下三个类:
Pattern类:
pattern对象是一个正则表达式的编译表示。Pattern类没有公共构造方法。要创建一个Pattern对象,你必须首先调用其公共静态编译方法,它返回一个Pattern对象。该方法接受一个正则表达式作为它的第一个参数。
Matcher类:
Matcher对象是对输入字符串进行解释和匹配操作的引擎。与Pattern类一样,Matcher也没有公共构造方法。你需要调用Pattern对象的matcher方法来获得一个Matcher对象。
PatternSyntaxException:
PatternSyntaxException是一个非强制异常类,它表示一个正则表达式模式中的语法错误。
捕获组
捕获组是把多个字符当一个单独单元进行处理的方法,它通过对括号内的字符分组来创建。
捕获组是通过从左至右计算其开括号来编号。例如,在表达式((A)(B(C))),有四个这样的组:
((A)(B(C)))
(A)
(B(C))
(C)
可以通过调用matcher对象的groupCount方法来查看表达式有多少个分组。groupCount方法返回一个int值,表示matcher对象当前有多个捕获组。
还有一个特殊的组(组0),它总是代表整个表达式。该组不包括在groupCount的返回值中。
实例:
1 import java.util.regex.Pattern; 2 import java.util.regex.Matcher; 3 4 public class RegexMatches{ 5 public static void main(String args[]){ 6 // 按指定模式在字符串查找 7 String line = "This order was placed for QT3000! OK?"; 8 9 String pattern = "(.*)(\\d+)(.*)";10 11 Pattern r = pattern.compile(pattern);// 创建 Pattern 对象12 Matcher m = r.matcher(line); // 现在创建 matcher 对象13 14 if(m.find()){15 System.out.println("Found value: " + m.group(0));16 System.out.println("Found value: " + m.group(1));17 System.out.println("Found value: " + m.group(2));18 }19 else{20 System.out.println("not Found");21 }22 }23 }
Found value: This order was placed for QT3000! OK?Found value: This order was placed for QT300Found value: 0
Mather类的方法
索引方法-start 和end 方法
1 import java.util.regex.Pattern; 2 import java.util.regex.Matcher; 3 public class RegexMatches 4 { 5 private static final String REGEX = "\\bcat\\b"; 6 private static final String INPUT = "cat cat cat cattie cat"; 7 8 public static void main(String args[]){ 9 Pattern p = Pattern.compile(REGEX);10 Matcher m = p.matcher(INPUT);11 int count = 0;12 while(m.find){13 count++;14 System.out.println("Match number"+count);15 System.out.println("start():"+m.start());16 System.out.println("end():"+m.end());17 }18 }
编译结果
Match number 1start(): 0end(): 3Match number 2start(): 4end(): 7Match number 3start(): 8end(): 11Match number 4start(): 19end(): 22
索引方法-matches 和lookingAt 方法
matches 和lookingAt 方法都用来尝试匹配一个输入序列模式。它们的不同是matcher要求整个序列都匹配,而lookingAt 不要求。
这两个方法经常在输入字符串的开始使用。
1 import java.util.regex.Pattern; 2 import java.util.regex.Matcher; 3 4 public class RegexMatches{ 5 private static final String REGEX = "foo"; 6 private static final String INPUT = "fooooooooooooo"; 7 private static Pattern pattern; 8 private static Matcher matcher; 9 10 public static void main(String args[])11 {12 pattern = Pattern.compile(REGEX);13 matcher = pattern.matcher(INPUT);14 15 System.out.println("current REGEX is:"+REGEX);16 System.out.println("current INPUT is:"+INPUT);17 18 System.out.println("LockingAt():"+matcher.lockingAt());19 System.out.println("matches():"+matcher.matches());20 }21 }
编译结果
current REGEX is: foocurrent INPUT is: fooooooooooooooooolookingAt(): truematches(): false
索引方法-replaceFirst 和replaceAll 方法
replaceFirst 和replaceAll 方法用来替换匹配正则表达式的文本。
不同的是,replaceFirst 替换首次匹配,replaceAll 替换所有匹配
1 import java.util.regex.Pattern; 2 import java.util.regex.Matcher; 3 4 public class RegexMatches{ 5 private static String REGEX = "dog"; 6 private static String INPUT = "The dog says meow. "+"All dogs say meow."; 7 private static String REPLACE = "cat"; 8 public static void main(String[] args) { 9 Pattern p = Pattern.compile(REGEX);10 //获取一个matcher object11 Matcher m = p.matcher(INPUT);12 INPUT = m.replaceAll(REPLACE);13 System.out.println(INPUT);14 }
}
编译结果
The cat says meow. All cats say meow.
索引方法-appendReplacement 和 appendTail 方法
Matcher 类也提供了appendReplacement 和appendTail 方法用于文本替换
1 import java.util.regex.Matcher; 2 import java.util.regex.Pattern; 3 4 public class RegexMatches{ 5 private static String REGEX = "a*b"; 6 private static String INPUT = "aabfooaabfoob"; 7 private static String REPLACE ="-"; 8 public static void main(String args[]){ 9 Pattern p = Pattern.compile(REGEX);10 Matcher m = p.matcher(INPUT);11 StringBuffer sb = new StringBuffer();12 13 while (m.find()){14 m.appendReplacement(sb,REPLACE);15 }16 m.appendTail(sb);17 System.out.println(sb.toString();)18 }
编译结果
-foo-foo-foo-
索引方法-PatternSyntaxException 类的方法
PatternSyntaxException 是一个非强制异常类,它指示一个正则表达式模式中的语法错误。
PatternSyntaxException 类提供了下面的方法来帮助我们查看发生了什么错误。
以下方法:
public String getDescription()
获取错误的描述。
public int getIndex()
获取错误的索引。
public String getPattern()
获取错误的正则表达式模式。
public String getMessage()
返回多行字符串,包含语法错误及其索引的描述、错误的正则表达式模式和模式中错误索引的可视化指示。
java-正则表达式方法