linux之grep

首页 > 代码库 > linux之grep

2024-09-15 12:42:39 217人阅读

一、grep简介

(1). grep （global search regular expression (RE) and print out the line ）,[全面搜索正则表达式并把行打印出来]是一种强大的文本搜索工具，他们使用正则表达式搜索文本，并且把匹配的行打印出来。

(2).grep家族包括grep、egrep和fgrep,其中egrep和fgrep的命令只跟grep有很小的不同。egrep是grep的扩展，支持更多的(RE)元字符.

(3)可用于shell脚本，因为grep通过返回一个状态值来说明搜索的状态，如果模板搜索成功，则返回0，如果不成功，则返回1，如果搜索不存在，则返回2，我们利用返回值可以进行一些自动化的文本处理工作。

（4）语法说明：

grep [options] PATTERN [FILE...]

-a或--text 不要忽略二进制的数据。
-A或--after-context= 除了显示符合范本样式的那一列之外，并显示该列之後的内容。
-b或--byte-offset 在显示符合范本样式的那一列之前，标示出该列第一个字符的位编号。
-B或--before-context= 除了显示符合范本样式的那一列之外，并显示该列之前的内容。
-c或--count 计算符合范本样式的列数。
-C或--context=或- 除了显示符合范本样式的那一列之外，并显示该列之前後的内容。
-d或--directories= 当指定要查找的是目录而非文件时，必须使用这项参数，否则grep指令将回报信息并停止动作。
-e或--regexp= 指定字符串做为查找文件内容的范本样式。
-E或--extended-regexp 将范本样式为延伸的普通表示法来使用。
-f或--file= 指定范本文件，其内容含有一个或多个范本样式，让grep查找符合范本条件的文件内容，格式为每列一个范本样式。
-F或--fixed-regexp 将范本样式视为固定字符串的列表。
-G或--basic-regexp 将范本样式视为普通的表示法来使用。
-h或--no-filename 在显示符合范本样式的那一列之前，不标示该列所属的文件名称。
-H或--with-filename 在显示符合范本样式的那一列之前，表示该列所属的文件名称。
-i或--ignore-case 忽略字符大小写的差别。
-l或--file-with-matches 列出文件内容符合指定的范本样式的文件名称。
-L或--files-without-match 列出文件内容不符合指定的范本样式的文件名称。
-n或--line-number 在显示符合范本样式的那一列之前，标示出该列的列数编号。
-o --仅显示匹配到的行
-q或--quiet或--silent 不显示任何信息。
-r或--recursive 此参数的效果和指定“-d recurse”参数相同。
-s或--no-messages 不显示错误信息。
-v或--revert-match 反转查找。
-V或--version 显示版本信息。
-w或--word-regexp 只显示全字符合的列。
-x或--line-regexp 只显示全列符合的列。
-y 此参数的效果和指定“-i”参数相同。
--help 在线帮助。

常见字符集：

[:alnum:] 匹配任意字母数字字符0-9、A-Z或a-z

[:alpha:] 匹配任意字母字符，不管是大写还是小写

[:blank:] 匹配空格或者制表符

[:digit:] 匹配0-9之间的数字

[:lower:] 匹配小写字母字符a-z

[:print:] 匹配任意可打印字符

[:punct:] 匹配标点符号

[:space:] 匹配任意空白字符：空格、制表符、NL、FF、VT、和CR

[:upper:] 匹配任意大写字母字符A-Z

文件名通配：

*	任意长度的任意字符
？	匹配任意单个字符
[ ]	匹配指定范围内的任意单个字符
[^]	匹配指定范围以外的任意单个字符

基本正则表达式：

字符匹配	.	匹配任意单个字符
	[ ]	匹配指定范围内的任意单个字符
	[^]	匹配指定范围外的任意单个字符

次数匹配	*	前面的字符可以出现任意次
	\?	前面的字符出现0次或者1次
	\{m\}	前面的字符出现m次
	\{m,n\}	前面的字符出现n次~m次
	\{m,\}	前面的字符至少出现m次
	\{0,n\}	前面的字符至多出现n次

任意长度的任意字符

位置锚定	^	行首锚定，写在模式的最左侧
	$	行尾锚定，写在模式的最右侧
	^$	匹配空行
	\<	词首锚定，出现于单词左侧
	\>	词尾锚定，出现于单词右侧

分组	\1	引用第1个括号所匹配到的内容，而非模式本身
	\2	引用第2个括号所匹配到的内容，而非模式本身
		匹配分组

扩展正则表达式：

字符匹配	.	匹配任意单个字符
	[ ]	匹配指定范围内的任意单个字符
	[^]	匹配指定范围外的任意单个字符

次数匹配	*	前面的字符可以出现任意次
	？	前面的字符出现0次或者1次
	+	前面的字符至少出现1次
	{m}	前面的字符出现m次
	{m,n}	前面的字符出现m次~n次
	{m,}	前面的字符至少出现m次
	{0，n}	前面的字符至多出现n次

锚定	^	行首锚定，写在模式的最左侧
	$	行尾锚定，写在模式的最右侧
	\<,\b	词首锚定，出现于单词左侧
	\>,\b	词尾锚定，出现于单词右侧
	^$	匹配空行