首页 > 代码库 > linux之grep

linux之grep

一、grep简介

(1). grep (global search regular expression (RE) and print out the line ),[全面搜索正则表达式并把行打印出来]是一种强大的文本搜索工具,他们使用正则表达式搜索文本,并且把匹配的行打印出来。

(2).grep家族包括grep、egrep和fgrep,其中egrep和fgrep的命令只跟grep有很小的不同。egrep是grep的扩展,支持更多的(RE)元字符.

(3)可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回0,如果不成功,则返回1,如果搜索不存在,则返回2,我们利用返回值可以进行一些自动化的文本处理工作。


(4)语法说明:

    grep [options] PATTERN [FILE...]

  • -a或--text 不要忽略二进制的数据。

  • -A或--after-context= 除了显示符合范本样式的那一列之外,并显示该列之後的内容。

  • -b或--byte-offset 在显示符合范本样式的那一列之前,标示出该列第一个字符的位编号。

  • -B或--before-context= 除了显示符合范本样式的那一列之外,并显示该列之前的内容。

  • -c或--count 计算符合范本样式的列数。

  • -C或--context=或- 除了显示符合范本样式的那一列之外,并显示该列之前後的内容。

  • -d或--directories= 当指定要查找的是目录而非文件时,必须使用这项参数,否则grep指令将回报信息并停止动作。

  • -e或--regexp= 指定字符串做为查找文件内容的范本样式。

  • -E或--extended-regexp 将范本样式为延伸的普通表示法来使用。

  • -f或--file= 指定范本文件,其内容含有一个或多个范本样式,让grep查找符合范本条件的文件内容,格式为每列一个范本样式。

  • -F或--fixed-regexp 将范本样式视为固定字符串的列表。

  • -G或--basic-regexp 将范本样式视为普通的表示法来使用。

  • -h或--no-filename 在显示符合范本样式的那一列之前,不标示该列所属的文件名称。

  • -H或--with-filename 在显示符合范本样式的那一列之前,表示该列所属的文件名称。

  • -i或--ignore-case 忽略字符大小写的差别。

  • -l或--file-with-matches 列出文件内容符合指定的范本样式的文件名称。

  • -L或--files-without-match 列出文件内容不符合指定的范本样式的文件名称。

  • -n或--line-number 在显示符合范本样式的那一列之前,标示出该列的列数编号。

  • -o  --仅显示匹配到的行

  • -q或--quiet或--silent 不显示任何信息。

  • -r或--recursive 此参数的效果和指定“-d recurse”参数相同。

  • -s或--no-messages 不显示错误信息。

  • -v或--revert-match 反转查找。

  • -V或--version 显示版本信息。

  • -w或--word-regexp 只显示全字符合的列。

  • -x或--line-regexp 只显示全列符合的列。

  • -y 此参数的效果和指定“-i”参数相同。

  • --help 在线帮助。


常见字符集:

[:alnum:]    匹配任意字母数字字符0-9、A-Z或a-z

[:alpha:]    匹配任意字母字符,不管是大写还是小写

[:blank:]    匹配空格或者制表符

[:digit:]    匹配0-9之间的数字

[:lower:]    匹配小写字母字符a-z

[:print:]    匹配任意可打印字符

[:punct:]    匹配标点符号

[:space:]    匹配任意空白字符:空格、制表符、NL、FF、VT、和CR

[:upper:]    匹配任意大写字母字符A-Z


文件名通配:


*任意长度的任意字符
匹配任意单个字符
[ ]匹配指定范围内的任意单个字符
[^]匹配指定范围以外的任意单个字符



基本正则表达式:


字符匹配.匹配任意单个字符

[ ]匹配指定范围内的任意单个字符

[^]匹配指定范围外的任意单个字符


次数匹配*前面的字符可以出现任意次

\?前面的字符出现0次或者1次

\{m\}前面的字符出现m次

\{m,n\}前面的字符出现n次~m次

\{m,\}前面的字符至少出现m次

\{0,n\}前面的字符至多出现n次




.*任意长度的任意字符



位置锚定^行首锚定,写在模式的最左侧

$行尾锚定,写在模式的最右侧

^$匹配空行

\<

词首锚定,出现于单词左侧

\>词尾锚定,出现于单词右侧



分组\1引用第1个括号所匹配到的内容,而非模式本身

\2引用第2个括号所匹配到的内容,而非模式本身

\(\)匹配分组



扩展正则表达式:



字符匹配.匹配任意单个字符

[ ]匹配指定范围内的任意单个字符

[^]匹配指定范围外的任意单个字符



次数匹配*前面的字符可以出现任意次

前面的字符出现0次或者1次

+前面的字符至少出现1次

{m}前面的字符出现m次

{m,n}前面的字符出现m次~n次

{m,}前面的字符至少出现m次

{0,n}前面的字符至多出现n次



锚定^行首锚定,写在模式的最左侧

$行尾锚定,写在模式的最右侧

\<,\b词首锚定,出现于单词左侧

\>,\b词尾锚定,出现于单词右侧

^$匹配空行


分组( )匹配一个分组

\1引用第1个括号所匹配到的内容,而非模式本身

grep正则表达式元字符

^    锚定行的开始 例如:‘^grep‘ 匹配所有以grep开头的行。

技术分享


$    锚定行的结束 例如:‘grep$‘ 匹配所有以grep结尾的行。

技术分享


.    匹配一个非换行符的字符 例如:‘gr.p‘ 匹配gr后面接一个任意字符,然后是p。

技术分享


*    匹配零个或多个先前字符 例如: ‘*grep‘ 匹配所有一个或多个空格后紧跟grep的行,.*一起用,代表任意字符。

技术分享


[]  匹配一个指定范围内的字符 例如:‘[Gg]rep‘ 匹配Grep和grep.

技术分享

[^] 匹配一个不在指定范围内的字符,例如:‘[^A-EG-Z]rep‘ 匹配不包含A-EG-Z开头,紧跟rep的行

技术分享


linux之grep