首页 > 代码库 > 09grep
09grep
n 基本框架:
a) grep命令
b) 正则表达式
c) grep中使用正则表达式
d) vi中使用正则表达式
9.1 grep命令
命令格式:grep [option] pattern + 文件列表
常用的option:
-E 用扩充的正则表达式进行模式匹配
-i 不区分大小写
-n 显示行号
-v 反向匹配(匹配不符合要求的)
-l 返回匹配到的文件名称
-r 递归搜索
在多个文件中进行查找时,文件列表中可以使用通配符*
9.2 正则表达式
定义:描述具有某种特征的字符串的表达式。
正则表达式包含普通字符和特殊字符(元字符)。
元字符集分为两类:基本的元字符集和扩充的元字符集。
9.2.1基本的元字符集:
u ^ 行首开始匹配
u $ 行尾进行匹配
找空行的方法: grep –n ^$ filename
u \< 从单词的开头进行匹配
3种方法:(若查找public)
grep -n ‘\<public’ filename(多用单引号的方法)
grep -n “\\<public” filename
grep -n \\\<public filename
² 执行机理:
grep命令中的pattern字段先被shell解析,然后再将解析后的结果提交给grep字段。
单引号可以抑制shell对pattern字段特殊字符的解析,将pattern字段原封不动的提交给grep 。
而双引号只能抑制部分符号(比如说括号),但它不能抑制\和$等。
Shell和grep都将\视为转义字符(特殊字符)。
u \> 从单词的末尾进行匹配
u . 对单个字符进行匹配
查找只有一个字符的行: grep -n ^.$ filename
u [str] 对str中的任意单个字符进行匹配
u [^str] 对任意不在str中的单个字符进行匹配
u [a-b] 对a到b之间的任何字符进行匹配
u \ 抑止后面的一个字符的特殊含义
查找\的三种方法:
1. grep -n ‘\\’ filename(多用单引号的方法)
2. grep -n “\\\\” filename
3. grep -n \\\\ filename
u * 对前一项进行0次或多次重复匹配
9.2.2扩展的元字符集:
使用扩展的元字符集grep的格式为: grep -E 或为 egrep
u + 对前一项进行1次或多次重复匹配
u { j } 对前一项进行j次重复匹配
u { j , K } 对前一项进行j到k次重复匹配
u s|t 匹配s项或t项中的一项
u (exp) 将exp 作为单项处理
9.3 vi中使用正则表达式
例子: 删除aa到zz的所有字符: 1,$ s/aa.*zz//
将整个文件中所有的and替换成&: 1,$ s/and/ \&/g
在每一行的行首插入字符串new: 1,$ s/^/new
在每一行的末尾插入字符串@@: 1,$ s/$/@@
去掉所有行首的数字字符: 1,$ s/^[0-9][0-9]*//