首页 > 代码库 > grep及正则表达式

grep及正则表达式

文本查找的需要:

grep,egrep,fgrep

grep:根据模式,搜索文本,并将符合模式的文本行显示出来。

Pattern:文本字符和正则表达式的元字符组合而成的匹配条件

grep [OPTIONS] PATTERN [FILE...]

 -i:忽略大小写

  --color:匹配高亮颜色

  -v:显示没被匹配到的行

  -o:只显示被模式匹配到的字符串


正则表达式:GEGular,EXPression,REGEXP

元字符:

.:匹配任意单个字符


匹配次数:

*:匹配其前面的字符任意次

[]:匹配指定范围内的任意单个字符

[^]:匹配指定范围外的任意单个字符

[:digit:],[:lower:],[:upper:],[:punct:],[:space:],[:alpha:],[:alnum:]这个是字符集合

用的时候加双中括号,例如: [[:digit:]]


 a,b,ab,aab,acb,adb,amnb

 a*b

[root@one ~]# grep a*b test.txt

b

ab

aab

acb

adb

amnb

 a.*b

[root@one ~]# grep ‘a.*b‘ test.txt

ab

aab

acb

adb

amnb


\?:匹配其前面的字符1次或0次

[root@one ~]# grep ‘a\?b‘ test.txt

b

ab

aab

acb

adb

amnb


\{m,n\}:匹配其前的字符至少m次,至多n次

  \{1,\}至少一次,多了不限

  \{0,3\}最多3次

[root@one ~]# grep ‘a\{1,3\}b‘ test.txt

ab

aab


位置锚定:

^:锚定行首,此字符后面的任意内容必须出现在行首

[root@one ~]# grep ‘^r..t‘ /etc/passwd

root:x:0:0:root:/root:/bin/bash


$:锚定行尾,次字符前面的任意内容必须出现在行尾

[root@one ~]# grep ‘b..h$‘ /etc/passwd

root:x:0:0:root:/root:/bin/bash

vagrant:x:500:500:vagrant:/home/vagrant:/bin/bash

tom:x:501:501::/home/tom:/bin/bash

user3:x:2002:1002:User3,be,110,119:/home/user3:/bin/bash

user4:x:1003:1003:Tony Blare:/home/blare:/bin/bash

user7:x:1006:1006::/home/user7:/bin/bash

apache:x:497:497::/home/apache:/bin/bash

hadoop:x:2003:2003::/home/hadoop:/bin/bash

^$:空白行


\<:其后面的任意字符必须作为单词首部出现

\>:其前面的任意字符必须作为单词的尾部出现

\b放在单词前面或者后面,表示锚定词首或者词尾


分组:

\(\)

  \(ab\)*

  后项引用

  \1:引用第一个左括号以及与之对应的右括号所包括的所有内容。

  \2:

  \3:


He love his lover.

She like her liker.

He like his lover.

[root@one ~]# grep ‘\(ab\)*‘ test.txt


a

b

ab

aab

acb

adb

amnb







grep及正则表达式