首页 > 代码库 > shell:正则表达式和文本处理
shell:正则表达式和文本处理
正则表达式
作业一:整理正则表达式博客
正则表达式
正则表达式就是一串字符组成的类单词的规则。
grep
grep命令在对一个或多个文件的内容进行基于模式的搜索的情况下是非常有用的。
模式可以是单个字符、多个字符、单个单词、或者是一个句子。
格式
grep [options]
主要参数
[options]主要参数:
-c:只输出匹配行的计数。
-I:不区分大 小写(只适用于单字符)。
-h:查询多文件时不显示文件名。
-l:查询多文件时只输出包含匹配字符的文件名。
-n:显示匹配行及 行号。
-s:不显示不存在或无匹配文本的错误信息。
-v:显示不包含匹配文本的所有行。
pattern正则表达式主要参数:
\: 忽略正则表达式中特殊字符的原有含义。
^:匹配正则表达式的开始行。
$: 匹配正则表达式的结束行。
\<:从匹配正则表达 式的行开始。
\>:到匹配正则表达式的行结束。
[ ]:单个字符,如[A]即A符合要求 。
[ - ]:范围,如[A-Z],即A、B、C一直到Z都符合要求 。
。:所有的单个字符。
* :有字符,长度可以为0。
正则介绍
^ 行首
$ 行尾
. 除了换行符以外的任意单个字符
* 前导字符的零个或多个
.* 所有字符
[] 字符组内的任一字符
[^] 对字符组内的每个字符取反(不匹配字符组内的每个字符)
^[^] 非字符组内的字符开头的行
[a-z] 小写字母
[A-Z] 大写字母
[a-Z] 小写和大写字母
[0-9] 数字
\< 单词头 单词一般以空格或特殊字符做分隔,连续的字符串被当做单词
\> 单词尾
作业二:grep作业(正则表达式及字符处理)
目标文件/etc/passwd,使用grep命令或egrep
1.显示出所有含有root的行:
2.输出任何包含bash的所有行,还要输出紧接着这行的上下各两行的内容:
3. 显示出有多少行含有nologin。
4.显示出那些行含有root,并将行号一块输出。
5.显示出文件中
6.新建用户
abominable
abominate
anomie
atomize
编写正则表达式,将他们匹配出来
7.建四个用户
Alex213sb
Wpq2222b
yH438PIG
egon666
egon
过滤出用户名组成是字母+数字+字母的行
8.显示出/etc目录下所有包含root的文件名
9. 过滤掉/etc/ssh/sshd_config内所有注释和所有空行
作业三:Sed作业:以/etc/passwd文件为模板
1,删除文件每行的第一个字符。
2,删除文件每行的第二个字符。
3,删除文件每行的最后一个字符。
4,删除文件每行的倒数第二个字符。
5,删除文件每行的第二个单词。
6,删除文件每行的倒数第二个单词。
7,删除文件每行的最后一个单词。
8,交换每行的第一个字符和第二个字符。
9,交换每行的第一个字符和第二个单词。
10,交换每行的第一个单词和最后一个单词。
11,删除一个文件中所有的数字。
12,删除每行开头的所有空格。
13,用制表符替换文件中出现的所有空格。
14,把所有大写字母用括号()括起来。
sed -r ‘s/[A-Z]/(&)/g‘ /etc/passwd
15,打印每行3次。
16,只显示每行的第一个单词。
17,打印每行的第一个单词和第三个单词。
18,用命令获取格式为 mm/yy/dd 的日期格式,结合管道,将其换成 mm;yy;dd格式
shell:正则表达式和文本处理