首页 > 代码库 > grep

grep

基本正则表达式

        正则表达式学习,主要是对正则表达式元数据的学习。正则表达式本身没有什么高深的东西,本文仅仅对基本正则表达式的元数据进行一下总结:


. 匹配任意一个字符。

        例如:grep –n ‘e.e’ regular.txt


        匹配e和e之间有任意一个字符,可以匹配eee,eae,eve,但是不匹配ee。



转义字符。

    例如:搜寻’,’是一个特殊字符,在正则表达式中有特殊含义。必须要先转义。



grep [-acinv] [--color=auto] [-A n] [-B n] ‘搜寻字符串‘ 文件名

参数说明:

-a:将二进制文档以文本方式处理

-c:显示匹配次数

-i:忽略大小写差异

-n:在行首显示行号

-A:After的意思,显示匹配字符串后n行的数据

-B:before的意思,显示匹配字符串前n行的数据

-v:显示没有匹配行-A:After的意思,显示匹配部分之后n行-B:before的意思,显示匹配部分之前n行

--color:以特定颜色高亮显示匹配关键字


一般习惯先输入 # alias grep=’grep –color’ =auto

来使得后续输入简便,仅输入grep便可获得 –color的效用


‘搜寻字符串’是正则表达式,注意为了避免shell的元字符对正则表达式的影响,请用单引号(’’)括起来,千万不要用双引号括起来(”)或者不括起来。


基本正则表达式

        字符匹配:

                .  用于匹配任意单个字符

                [] 匹配指定集合中的任意单个字符

                   [[digit]],[0-9]

                   [[lower]],[a-z]

                   [[upper]],[A-Z]

                   [[alpha]],[a-zA-Z]

                   [[alnum]],[0-9a-zA-Z]

                   [[space]],[所有空白字符]

                   [[punct]],[所有特殊字符]

                [^]匹配指定集合外的任意单个字符

            匹配次数:用于实现对这个字符前面紧邻着字符所能够出现的次数做出限定

                :匹配其前面的字符任意次,0,1或多次

                   例如:grep‘xy‘

                      xy,sy,aby,abc中xy,sy,aby能被匹配到,abc不能

                      贪婪模式,能匹配多次就匹配多长,越多越好

                 :匹配其前面的字符0次或1次;

                    例如:grep ‘xy‘

                    xy,xxy,y,xxxxxy,aby

                

                +:匹配其前面的字符至少1次

                {m}:匹配其前面的字符m次;

                    例如:grep ‘x{2}y‘ 

                    xy,xxy,y,xxxxy,aby,    只有xxy,和xxxxy的后面两个x会被匹配

                    

                {m,n}:匹配其前面的字符至少m次,至多n次;

                

                grep ‘x{2,}y‘至少两次


                .:匹配任意长度的任意字符

        位置锚定符:

            ^:行首锚定

                   必须出现在模式的最左侧

            $:行尾锚定

                   必须写在模式的最右侧

            ^&:空白行

            :词首锚定

                出现在要查找的单词模式的最侧:char

            :词尾锚定

                出现在要查找的单词模式的右侧:char

            pattern:匹配单词


分组:

            ()


   后向引用:模式中,如果使用()实现了分组,在某行文本的检查中,如果()的模式匹配到了某内容,此内容后面的模式中可以被引用;

                1,2,3

  模式自左向右,引用第#个左括号以及与其匹配的右括号之间的模式匹配到的内容;


扩展正则表达式

     grep一般情况下支持基本正则表达式,可以通过参数-E支持扩展正则表达式,另外grep单独提供了一个扩展命令叫做egrep用来支持扩展正则表达式,这条命令和grep -E等价。虽然一般情况下,基本正则表达式就够用了。特殊情况下,复杂的扩展表达式,可以简化字符串的匹配。


    扩展正则表达式

     grep一般情况下支持基本正则表达式,可以通过参数-E支持扩展正则表达式,另外grep单独提供了一个扩展命令叫做egrep用来支持扩展正则表达式,这条命令和grep -E等价。虽然一般情况下,基本正则表达式就够用了。特殊情况下,复杂的扩展表达式,可以简化字符串的匹配。


     扩展正则表达式就是在基本正则表达式的基础上,增加了一些元数据。

意义和范例


+ 重复前面字符1到多次。

例如:匹配god,good,goood等等字符串。


grep –nE go+d’ regular.txt



匹配0或1次前面的字符

例如,匹配gd,god


grep –nE ‘god’ regular.txt



或(or)的方式匹配多个字串  

例如:grep –nE ‘godgood’ regular.txt

匹配god或者good。



() 匹配整个括号内的字符串,原来都是匹配单个字符

例如:搜寻good或者glad


grep –nE ‘g(oola)’ regular.txt



() 前面的字符重复0到多次。

例如匹配gle,gogle,google,gooogle等等


grep –nE ‘gogle’ regular.txt



egrep及扩展的正则表达式

         扩展正则表达式的元字符:

            字符匹配:

                .

                []

                [^]

            匹配次数限定:

                :不限次数

                ?:匹配其前面的字符0次或1次;

                +:匹配其前面的字符至少1次

                {m}:匹配其前面的字符m次;

                {m,n},{m,},{0,n}

            锚定:

                ^

                $

                , b

            分组:

                ()


                支持后向引用:1,2,3,...

            或者:

                ab:a或者b

                abcd:ab或cd

                a(bc)d:abd或acd


            # grep -E ‘pattern‘ file...

            # grep ‘pattern‘ file...


grep