正则表达式与grep

首页 > 代码库 > 正则表达式与grep

2024-08-17 12:10:30 220人阅读

文本编辑工具

grep：是一种强大的文本搜索工具，它能使用正则表达式搜索文本，并把匹配的行打印出来；

sed ：是一种流编辑器，它是文本处理中非常中的工具，能够完美的配合正则表达式使用；

awk ：是一种编程语言，用于在linux/unix下对文本和数据进行处理；

grep使用

grep [OPTION] PATTERN [FILE…]

grep [OPTIONS] [-e PATTERN | -f FILE] [FILE…]

选项：

–color=auto：自动加颜色；

-i ：ignorecase，忽略字符大小写；

-o ：仅显示匹配道德字符串本身；

-v ：–invert-match：显示不能被模式匹配到的行；

-E ：支持使用扩展的正则表达式元字符；

-q ：不输出任何信息；

-A<显示列数>：除了显示符合范本样式的那一行之外，并显示该行之后的内容；

-B<显示列数>：在显示符合范本样式的那一行之外，并显示该行之前的内容；

-C<显示列数>：除了显示符合范本样式的那一列之外，并显示该列之前后的内容；

正则表达式

正则表达式，又称规则表达式。正则表通常被用来检索、替换那些符合某个模式(规则)的文本。

正则表达式元字符

（1）字符匹配：

. ：匹配任意单个字符；

[] ：匹配指定范围内的任意单个字符；

[^] ：匹配指定范围外的任意单个字符；

（2）匹配次数：

* ：匹配其前面的字符任意次；

.* ：匹配任意长度的任意字符；

\? ：匹配其前面的字符至多1次；

\+ ：匹配其前面的字符至少1次；

\{m\} ：匹配其前面的字符m次；

\{m,n\} ：匹配其前面的字符至少m次，至多n次；

\{0,n\} ：匹配其前面的字符至多n次；

\{m,\} ：匹配其前面的字符至少m次；

（3）位置锚定：

^ ：行首锚定；

$ ：行尾锚定；

^PATTERN$ ：用PATTERN来匹配整行；

^$ ：匹配空白行；

^[[:space:]]*$ ：包含空白字符的行或空行；

单词：非特殊字符组成的连续字符；

\<或<b ：词首锚定；

\>或\b ：词尾锚定；

\<PATTERN\> ：匹配完整单词；

（4）分组及引用：

 ：将一个或多个字符当作一个整体；分组括号中的内容会被记录于内部变量中，可作为引用；

后向引用：

\1 ：引用第一个括号中匹配到的字符；

\2 ：引用第二个括号中匹配到的字符；

… …

示例

1.显示当前系统上root、fedora或user1用户的默认shell；

# less /etc/passwd | egrep "^(root|fedora|user1)\>" | cut -d: -f1,7
root:/bin/bash
user1:/bin/bash
fedora:/bin/bash
 
或
 
# less /etc/passwd | grep "^\(root\|fedora\|user1\)\>" | cut -d: -f1,7
root:/bin/bash
user1:/bin/bash
fedora:/bin/bash

2.找出/etc/rc.d/init.d/functions文件中某单词后面跟一组小括号的行，形如：hello()；

# egrep "\<[[:alnum:]]+\(\)" /etc/rc.d/init.d/functions
checkpid() {
daemon() {
killproc() {
pidfileofproc() {
pidofproc() {
status() {
success() {
failure() {
passed() {
warning() {
action() {
strstr() {

3.使用echo命令输出一个绝对路径，使用grep取出其基名；

扩展：取出其路径名；

# echo "/var/log/cron" | egrep -o "[^/]+/?$"
 
# echo "/var/log/cron" | egrep -o "^(/[^/]+)+/$"

4.找出ifconfig命令结果中的1-255之间数字；

# ifconfig | egrep -o "[1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5]"

5.挑战题：写一个模式，能匹配合理的IP地址；

# ifconfig | egrep -o "(([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\.){3}([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])"

6.挑战题：写一个模式，能匹配出所有的邮件地址；

# egrep -o "[[:alnum:]]+\@[[:alnum:]]+\.[[:alnum:]]"

7.查找/var目录下属主为root，且属组为mail的所有文件或目录；

# find /var  -user root -a -group mail

8.查找当前系统上没有属主或属组的文件；

进一步：查找当前系统上没有属主或属组，且最近3天内曾被访问过的文件或目录；

# find / -nouser -o  -nogroup
 
# find / \( -nouser -o -nogroup \) -atime -3

9.查找/etc目录下所有用户都有写权限的文件；

# find /etc -perm -222

10.查找/etc目录下大于1M，且类型为普通文件的所有文件；

# find /etc/ -size +1M -type f -exec ls -lh {} \

11.查找/etc/init.d/目录下，所有用户都有执行权限，且其它用户有写权限的文件；

# find /etc/init.d/ -perm -113 -type f

12.查找/usr目录下不属于root、bin或hadoop的文件；

# find /usr/ -not \( -user root -o -user bin -o -user hadoop \)

13.查找/etc/目录下至少有一类用户没有写权限的文件；

# find /etc/ -not -perm -222

14.查找/etc目录下最近一周内其内容被修改过，且不属于root或hadoop的文件；

# find /etc -mtime -7 -a -not \( -user root -o -user hadoop \)

正则表达式与grep

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > 正则表达式与grep

正则表达式与grep

文本编辑工具

grep使用

正则表达式

正则表达式元字符

示例

看完仍有疑问？有类似问题直接问程序猿