首页 > 代码库 > 扩展正则表达式

扩展正则表达式

扩展正则表达式

事实上,一般实验者只需要熟悉基础的正则表达式就足够了。不过有时候为了简化命令操作,了解一些使用范围更广的扩展表达式,会更加方便。

一、简单对比

正规表示法:

$ grep -v ‘^$‘ regular_express.txt |grep -v ‘^#‘

需要使用到管线命令来搜寻两次! 那么如果使用延伸型的正规表示法,我们可以简化为:

$ egrep -v ‘^$|^#‘ regular_express.txt

利用支持延伸型正规表示法的 egrep 与特殊字符 “|” 的组功能来区隔两组字符串,如此一来,是否方便很多呢?

此外,grep 默认仅支持基础正则表达式,如果要使用扩展性正则表达式,可以使用 grep - E。grep -E 与 egrep 相当于命令别名关系。

二、扩展规则

1、 + :表示重复一个或一个以上的前一个 RE 字符

$ egrep -n ‘go+d‘ regular_express.txt

普通写法:

 $ grep -n ‘goo*d‘ regular_express.txt

2、 ? : 表示重复零个或一个前一个 RE 字符

$ egrep -n ‘go?d‘ regular_express.txt

操作截图:

技术分享

上述三条命令结果如上,发现 ‘goo*d’ 与 ‘go+d’ 等同,而 ‘go?d’ 结果不同。

3、 | :表示用或的方式找出数个字符串

$ egrep -n ‘gd|good‘ regular_express.txt

4、 () : 表示找出群组字符串

$ egrep -n ‘g(la|oo)d‘ regular_express.txt

也就是搜寻(glad)或 good 这两个字符串

操作截图:

技术分享

5、()+ : 多个重复群组判别

$ echo ‘AxyzxyzxyzxyzC‘|egrep ‘A(xyz)+C‘

$ echo ‘AxyzxyzxyzxyzC‘|egrep ‘A(xz)+C‘

也就是要找开头是 A 结尾是 C 中间有一个以上的 ‘xyz’ 或 ‘xz’ 字符串的意思。

结果显示 ‘A(xyz)+C’ 可以匹配, ‘A(xz)+C’ 没有匹配项。

操作截图:

技术分享

扩展正则表达式