首页 > 代码库 > grep、egrep、正则表达式
grep、egrep、正则表达式
Linux的基本概念之一,一切皆文件,平时我们在做大多数操作的时候,都是在对文件进行操作,此时我们就需要一种文本搜索工具,可以根据我们所指定的特定格式的内容,过滤出我们想要的段落,从而实现在一段复杂的文本中,过滤出特定的内容,而我们把这段特定的格式叫做模式;
Global search REgular expression and Printout the line. 全局搜索正则表达式并打印出符合条件的行
文本搜索工具,可以根据用户所指定的“模式”(pattern)对目标文件进行过滤,显示被模式匹配到的行;
正则表达式:由一类字符书写的模式,其中有些字符不表示字符的字面意义,而是表示控制或通配功能;
元字符:不表示字面意义,而表示通配功能的字符
正则表达式:
基本正则表达式
扩展正则表达式
用法:
grep [OPTION]...‘PATTERN’ FILE...
option:
-v:反向选取,显示出匹配指定模式以外的内容
-o:仅显示匹配到的内容
-i:忽略字符大小写
-E:使用扩展的正则表达式
-A#:显示匹配到的行,及其后#行的内容
-B #:显示匹配到的行,及前#行的内容
-C #:显示匹配到的行,及其前后# 行的内容
PATTERN:模式,可以是普通的字符串,也可以是正则表达式(模式需加引号)
字符匹配:
.:匹配任意一个单个字符;
*:匹配其前的任意长度任意字符;
\?:匹配其前字符0个或1个;
\+:匹配其前字符至少一次;
[:digit:]:匹配全部数字[0-9]
[:lower:]:匹配全部小写字母 [a-z]
[:upper:]:匹配全部大写字母 [A-Z]
[:alpha:]:匹配全部大小写字母[a-z][A-Z]
[:alnum:]:匹配大小写字母和数字 [a-z][A-Z][0-9]
[:punct:]:匹配所有标点符号
[:space:]:匹配全部空白字符空格、Tab等
[^]:匹配指定模式以外的字符
\{n\}:匹配其前字符出现了n次;
\{n,\}:匹配其前字符出现了至少n次;
\{n,m\}:匹配其前字符出现了n到m次;
.*:匹配任意长度任意字符;
位置锚定:
^:锚定行首
$:锚定行尾
^$:锚定空白行
\<:锚定词首
\>:锚定词尾
\b:锚定词首或词尾,功能同 \< 或 \>
分组:
\(\):常用在模式中前面匹配到了指定的字符串,而这段字符后面也需要引用相同的字符串;
\(\):匹配 \1 \2 \3 引用 ;
模式自左而右,引用第# 个左括号以及与其基本右括号之间的模式匹配到的内容;
例: root:x:0:0::/home/root:/sbin/nologin
tom:x:0:0::/home/tom:/sbin/nologin
此时我想匹配用户名和家目录
grep ‘\(^\<[[:alpha:]]*\>\).*\1’filename
extended grep :扩展的 grep
egrep [OPTION] <patter> filename
字符匹配:
.:匹配单个任意字符;
*:匹配其前字符0次1次或多次
+:匹配其前字符至少一次
?:匹配其前字符0次或1次
[:digit:]:匹配全部数字[0-9]
[:lower:]:匹配全部小写字母 [a-z]
[:upper:]:匹配全部大写字母 [A-Z]
[:alpha:]:匹配全部大小写字母[a-z][A-Z]
[:alnum:]:匹配大小写字母和数字 [a-z][A-Z][0-9]
[:punct:]:匹配所有标点符号
[:space:]:匹配全部空白字符空格、Tab等
[^]:匹配指定模式以外的字符
{n}:匹配其前字符出现了n次;
{n,}:匹配其前字符出现了至少n次;
{n,m}:匹配其前字符出现了n到m次;
.*:匹配任意长度任意字符;
位置锚定:
^:锚定行首
$:锚定行尾
^$:锚定空白行
\<:锚定词首
\>:锚定词尾
\b:锚定词首或词尾
分组:
():
常用在模式中前面匹配到了指定的字符串,而这段字符后面也需要引用相同的字符串;
():匹配 \1 \2 \3 引用 ;
模式自左而右,引用第# 个左括号以及与其基本右括号之间的模式匹配到的内容;
或者:
a|b:a或者b
ab|cd:ab或者 cd ,表示整个;
a(b)|(c)d:这个表示单一一个或;
# grep -E ‘pattern‘ file ...
# egrep ‘pattern‘ file ...
本文出自 “那些颠沛留离的日子。” 博客,请务必保留此出处http://linuxzj.blog.51cto.com/6160158/1577153
grep、egrep、正则表达式