首页 > 代码库 > Linux文本处理三剑客之grep

Linux文本处理三剑客之grep


        Linux 下有三大文本处理工具,分别是grep,sed,awk.现在来总结一下grep的使用。

       grep (global search regular expression(RE) and print out the line,全

面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表

达式搜索文本,并把匹配的行打印出来。Unix的grep家族包括grep、egrep和

fgrep。egrep和fgrep的命令只跟grep有很小不同。egrep是grep的扩展,支持更

多的re元字符, fgrep就是fixed grep或fast grep,它们把所有的字母都看作单

词,也就是说,正则表达式中的元字符表示回其自身的字面意义,不再特殊。Linux

使用GNU版本的grep。它功能更强,可以通过-G、-E、-F命令行选项来使用

egrep和fgrep的功能。

        grep的工作方式是这样的,它在一个或多个文件中搜索字符串模板。如果模板包括空格,则必须被引用,模板后的所有字符串被看作文件名。搜索的结果被送到屏幕,不影响原文件内容。

       grep可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回0,如果搜索不成功,则返回1,如果搜索的文件不存在,则返回2。我们利用这些返回值就可进行一些自动化的文本处理工作。

      

匹配模式选择:
 -E, --extended-regexp     扩展正则表达式egrep
 -F, --fixed-strings       一个换行符分隔的字符串的集合fgrep
 -G, --basic-regexp        基本正则
 -P, --perl-regexp         调用的perl正则
 -e, --regexp=PATTERN      后面根正则模式,默认无
 -f, --file=FILE           从文件中获得匹配模式
 -i, --ignore-case         不区分大小写
 -w, --word-regexp         匹配整个单词
 -x, --line-regexp         匹配整行
 -z, --null-data           一个 0 字节的数据行,但不是空行
 -s, --no-messages         不显示错误信息
 -v, --invert-match        显示不匹配的行 (反向查找)


输入控制:
 -m, --max-count=NUM       匹配的最大数
 -b, --byte-offset         打印匹配行前面打印该行所在的块号码。
 -n, --line-number         显示的加上匹配所在的行号
 --line-buffered           刷新输出每一行
 -H, --with-filename       当搜索多个文件时,显示匹配文件名前缀
 -h, --no-filename         当搜索多个文件时,不显示匹配文件名前缀
 -q, --quiet, --silent      不显示任何东西
 --binary-files=TYPE   假定二进制文件的TYPE 类型;
                                      TYPE 可以是`binary‘, `text‘, 或`without-match‘
 -a, --text                匹配二进制的东西
 -I                        不匹配二进制的东西
 -d, --directories=ACTION  目录操作,读取,递归,跳过
 -D, --devices=ACTION      设置对设备,FIFO,管道的操作,读取,跳过
 -R, -r, --recursive           递归调用
 --include=PATTERN     只查找匹配FILE_PATTERN 的文件
 --exclude=PATTERN     跳过匹配FILE_PATTERN 的文件和目录
 --exclude-from=FILE   跳过所有除FILE 以外的文件
 -L, --files-without-match 匹配多个文件时,显示不匹配的文件名
 -l, --files-with-matches  匹配多个文件时,显示匹配的文件名
 -c, --count               显示匹配了多少次
 -Z, --null                在FILE 文件最后打印空字符

 
文件控制:
 -B, --before-context=NUM  打印匹配本身以及前面的几个行由NUM控制
 -A, --after-context=NUM   打印匹配本身以及随后的几个行由NUM控制
 -C, --context=NUM         打印匹配本身以及随后,前面的几个行由NUM控制
 -NUM                      根-C的用法一样的
 --color[=WHEN],
 --colour[=WHEN]       使用标志高亮匹配字串;
 
 -U, --binary               使用标志高亮匹配字串;
 
 
 例1:

 测试文件
 root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
rpcuser:x:29:29:RPC Service User:/var/lib/nfs:/sbin/nologin
nfsnobody:x:65534:65534:Anonymous NFS User:/var/lib/nfs:/sbin/nologin
qemu:x:107:107:qemu user:/:/sbin/nologin
abrt:x:173:173::/etc/abrt:/sbin/nologin
pulse:x:171:171:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
gdm:x:42:42::/var/lib/gdm:/sbin/nologin
gnome-initial-setup:x:993:991::/run/gnome-initial-setup/:/sbin/nologin
sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin
tcpdump:x:72:72::/:/sbin/nologin
willis:x:1000:1000:willis:/home/willis:/bin/bash
print:x:1001:1001::/home/print:/bin/bash

1.匹配含有root的行
 [root@localhost test1]# grep root file
root:x:0:0:root:/root:/bin/bash

2.匹配以root开头或者以willis开头的行
[root@localhost test1]# cat file |grep ‘^\(root\|willis\)‘
root:x:0:0:root:/root:/bin/bash
willis:x:1000:1000:willis:/home/willis:/bin/bash
 
 3.匹配不以bin开头的行,并显示行号
 [root@localhost test1]# cat file | grep -v -n ^bin
1:root:x:0:0:root:/root:/bin/bash
3:rpcuser:x:29:29:RPC Service User:/var/lib/nfs:/sbin/nologin
4:nfsnobody:x:65534:65534:Anonymous NFS User:/var/lib/nfs:/sbin/nologin
5:qemu:x:107:107:qemu user:/:/sbin/nologin
6:abrt:x:173:173::/etc/abrt:/sbin/nologin
7:pulse:x:171:171:PulseAudio System Daemon:/var/run/pulse:/sbin/nologin
8:gdm:x:42:42::/var/lib/gdm:/sbin/nologin
9:gnome-initial-setup:x:993:991::/run/gnome-initial-setup/:/sbin/nologin
10:sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin
11:tcpdump:x:72:72::/:/sbin/nologin
12:willis:x:1000:1000:willis:/home/willis:/bin/bash
13:print:x:1001:1001::/home/print:/bin/bash

 4.匹配显示的个数,不显示内容
 [root@localhost test1]# cat file | grep -c root
1
[root@localhost test1]# cat file | grep -c bin
13
[root@localhost test1]# cat file | grep -c willis
1

 5.匹配显示root后3行
 [root@localhost test1]# cat file | grep -A 3 root
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
rpcuser:x:29:29:RPC Service User:/var/lib/nfs:/sbin/nologin
nfsnobody:x:65534:65534:Anonymous NFS User:/var/lib/nfs:/sbin/nologin

本文出自 “技术人生,简单不简单” 博客,请务必保留此出处http://willis.blog.51cto.com/11907152/1845868

Linux文本处理三剑客之grep