首页 > 代码库 > grep ,正则表达式

grep ,正则表达式

grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。Unix的grep家族包 括grep、egrep和fgrep。egrep和fgrep的命令只跟grep有很小不同。egrep是grep的扩展,支持更多的re元字符, fgrep就是fixed grep或fast grep,它们把所有的字母都看作单词,也就是说,正则表达式中的元字符表示回其自身的字面意义,不再特殊。linux使用GNU版本的grep。

grep的工作方式是这样的,它在一个或多个文件中搜索字符串模板。如果模板包括空格,则必须被引用,模板后的所有字符串被看作文件名。搜索的结果被送到屏幕,不影响原文件内容。

grep可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回0,如果搜索不成功,则返回1,如果搜索的文件不存在,则返回2。我们利用这些返回值就可进行一些自动化的文本处理工作。

正则表达式分类

基本正则表达式    (Basic Regular Expression )  BREs

扩展正则表达式    (Extend Regular Expression ) EREs

perl的正则表达式  (Perl Regular Expression ) PREs

格式

grep  [options]  pattern [file…]

选项和参数 (比较常用的选项,了解更多使用man grep 查看)

--color=auto

-n                            加上相对应的行号

-v  --invert-match 反向选取

-o  --only-matching 只显示被模式匹配到的字串 ,而不是整个行

-i   --ignore-case      忽略大小写

-l   --files-with-matches 只列出匹配的文件名

-L  --files-without-matches 只列出不匹配的文件名

-w  --word-regexp 匹配完整字符串(单词)

-A  Number 显示匹配到的行 并显示其后面的Number行

-B   Number 显示匹配到的行 并显示其前面的Number行

-C   Number           ……               显示前后面的Number行

-E   --extended-regexp  支持扩展正则表达式


元字符:

^:锚定行首的符合条件的内容,用法格式“^grep”;

$:锚定行尾的符合条件的内容,用法格式“grep$”;

.:匹配任意单个字符;

*:匹配紧挨在其前面的字符任意次;

.*:匹配任意长度的任意字符;

[]:匹配包含内的任一字单个字符;

[^]:匹配包含外的任一字单个字符;

\:将下一字符标记为特殊字符、文本、反向引用或八进制转义符;

\?:匹配紧挨在其前面的字符0次或1次;

\<:锚定词首

\>:锚定词尾

x\{m\}:匹配其前面的字符“x”m次(精确匹配);

x\{m,\}:匹配其前面的字符“x”至少m次;

x\{m,n\}:匹配其前面的字符“x”至少m次,至多n次;

\(\):分组;


字符集合:

[:lower:]:代表小写字母,即 a-z

[:upper:]:代表大写字母,即 A-Z

[:digit:]:代表数字,即 0-9

[:alpha:]:代表任何英文大小写字母,即 a-z A-Z

[:alnum:]:代表英文大小字符及数字,即 0-9 a-z A-Z

[:space:]:代表空格键与Tab按键

[:punct:]:代表标点符号,即 “  , ;? ! : # $


grep及正则表达式实例

1. 在/etc/paswd文件查找匹配root的串 并以高亮显示其匹配的字符串

tmpE06D3[3]_thumb[1]_thumb_thumb


2.  在/etc/passwd文件中查找以root开头的行 并将其显示

tmpCEB43_thumb

通过行其锚定进行匹配 此次匹配的内容仅是以root开头的行 在其他位置出现的不匹配


3. 在/etc/passwd文件中查找以/bin/bash结尾的行 并将其显示

tmp250E3_thumb


4. 在/etc/passwd文件中查找bin的字符串和锚定后bin字符串的比较

tmp2B663_thumb


锚定后  


tmp741A3_thumb

通过锚定/< />进行字符串完全匹配 如果不适用锚定符 将会有/sbin类似的字符串一起出来


5.在/etc/passwd文件中查找匹配俩个bin之间包含的任意字符的行

tmp7DAC3_thumb

该查找以bin为分组进行匹配 命令中\1 表示引用第一个分组的内容 如果字符串中有多个分组
可以用\2\3进行引用第二分组及第三分组中的字符串

6.在/etc/passwd文件中查找匹配o 并至少出现2次的字符串的行

tmpC91E3_thumb

匹配前面字符至少2次 至少出现2次或者更多次 比如 rooot 也会一起出现的


7.在/etc/fstab文件中以#开头 且后面跟一个或者多个空白字符 而后又跟任意非空白字符的行

tmpF77F3_thumb


8. 显示/etc/fstab文件中的内容 并不显示以#开头和空白行

tmp36153_thumb


简单介绍到这里  后续更新 如不足之处 请多多提议