首页 > 代码库 > [正则表达式]PCRE环视功能
[正则表达式]PCRE环视功能
设想一下这个问题,假设为了方便长串数字的阅读性,需要为其添加逗号作为分隔,需要怎么做呢?
2569836495 =》 2,569,836,495
正则表达式的匹配通常是从左往右的,这导致无法使用类似[\d]{3}这样的方法去解决问题,因为数字是从右边结算的
用s/([\d]{3})/$1,/g处理上面的数字,只会得到这样的结果
2569836495 =》 256,983,649,5
显然这是错误的标记方法
幸好PCRE提供了[顺序环视],和[逆序环视]功能
[顺序环视]:(?=REG),例如(?=\d),将会匹配右边符合\d条件的位置。
[逆序环视]:(?<=REG),例如(?<=\d),将会匹配右边符合\d条件的位置。
注意:两个匹配方式都强调了“位置”二字,因为环视匹配模式,只匹配位置。
这个例子说明一下:
现有字符串:"SELECT * FROM",匹配表达式:(?=SELECT)
表达式的意思是,匹配满足括号内的条件(这里是SELECT)的字符的左边位置
结果将会是这样:"[我是位置,我被匹配了]SELECT * FROM"
还不能理解的话,继续修改一下表达式:(?=SELECT)SEL
此时红色字体部分被匹配了,"SELECT * FROM"
解析一下:(?=SELECT)匹配了"[我是位置,我被匹配了]SELECT * FROM",接下来从这个位置开始,需要紧接着SEL,于是"SELECT * FROM"被匹配了。
而逆序环视也是差不多的原理,只不过匹配方式是从左起
还是使用刚才的字符串:"SELECT * FROM",匹配表达式:(?<=SELECT)
表达式的意思是,匹配满足括号内的条件(这里是SELECT)的字符的右边位置
结果将会是这样:"SELECT[我是位置,我被匹配了] * FROM"
还不能理解的话,继续修改一下表达式:ECT(?<=SELECT)
此时红色字体部分被匹配了,"SELECT * FROM"
解析一下:ECT首先是要被匹配的,接下来必须紧接着匹配SELECT的右边位置才能完成整个匹配。
再来一个结合了顺序和逆序环视的例子:(?<=SELECT).*(?=FROM)
结果是SELECT和FROM之间的字符被匹配了,"SELECT * FROM",注意结果是包括的空格哦,没显示红色部分是因为空格标注不了红色。。。
如果不能理解,回头看多几遍介绍,一定会明白的。
[正则表达式]PCRE环视功能