首页 > 代码库 > 12-sed命令详解

12-sed命令详解


sed

作者:矮哥

归档:学习笔记

2017/02/05

 

1.1 功能与版本

sed命令时操作,过滤和转换文本内容的强大工具。常用功能有增删改查。期中查询的功能中最常用的2大功能时过滤,取行

[root@AIGE cron]# sed --version

GNU sed version 4.2.1

[root@AIGE cron]# uname -r

2.6.32-642.el6.x86_64

[root@AIGE cron]# cat /etc/redhat-release

CentOS release 6.8 (Final)

1.1.1 语法格式

sed [options] [sed-commands] [input-file]

说明:

1. 注意sed软件及后面选项,sed命令和输入文件,每隔元素之间都至少有一个空格。

2. sed-commands既可以是单个sed命令,也可以是多个sed命令组合

3. input-file(输入文件)是可选项,sed还能够从标准的输入如管道获取输入

1.1.2 命令执行流程

概括:sed软件从文件或管道中读取一行,处理一行,输出一行,然后继续第二行,循环至文件结束。

流程图:

sed软件有两个内置的存储空间:

模式空间(pattern space):是sed软件从文件读取一行文本然后存入的缓冲区(这个缓冲区是在内存中的),然后使用sed命令操作模式空间的内容。

保持空间(hold space):是sed软件另一个缓冲区,用来存放临时数据,也是在内存中的,但是模式空间和保持空间的用途是不一样的。sed可以交换保持空间和模式空间的数据,但是不能在保持空间上执行普通的sed命令,也就是说我们可以在保持空间存储数据。

初始情况,模式空间和保持空间都是没有内容的。每次循环读取数据的过程中,模式空间的原内容都会被清空写入新的内容。但保持空间的内容保持不变,不会在循环中被删除,除非使用sed命令操作保持空间。

1.1.3 参数说明:

[options][选项]

解释说明

-n

取消默认的sed软件的输出,常与sed命令的P连用

-e

一行命令语句可以执行多条sed命令

-f

选项后面可以接sed脚本的文件名

-r

使用扩展正则表达式,默认情况sed只识别基本正则表达式

-i

直接修改文件内容,而不是输出到终端,如果不使用-i选项sed软件只是修改在内存中的数据,并不会影响磁盘上的文件

sed-commands

[sed命令]

解释说明

a

追加,在指定行后面添加一行或多行文本

c

取代指定的行

d

删除指定的行

D

删除模式空间的部分内容,知道遇到换行符、n结束操作,与多行模式相关

i

插入,在指定行前添加一行或多行文本

h

把模式空间的内容追加到保持空间

g

把保持空间的内容复制到模式空间

G

把保持空间的内容追加到模式空间

x

交换模式空间和保持空间的内容

l

打印不可见的字符

n

清空模式空间的内容并读入下一行

N

不清空模式空间,并读取下一行数据并追加到模式空间

p

打印模式空间的内容,通常p会与选项-n一起使用

q

退出sed

r

从指定文件读取数据

s

取代,s#old#new#g。这里g是s命令的替代标志,注意和g命令区分

w

另存,把模式空间的内容保存到文件中

y

根据对应位置转换字符

:label

定义一个标签

b label

执行该标签后面的命令

t

如果前面的命令执行成功,那么跳转到t指定的标签处,继续往下执行后续的命令,否则,仍然继续正常的执行流程

特殊符号

解释说明

!

对指定行以外的所有行应用命令

=

打印当前行行号

~

"First ~Step"表示从First行开始,以步长Step递增

&

代表被替换的内容

;

实现一行命令语句可以执行多条sed命令

{}

对单个地址或地址范围执行批量操作

+

地址范围中用到的符号,做加法运算

1.2 增删改查

实验文本:

技术分享
  1 [root@AIGE aige]# cat lirc.txt 
  2 
  3 I look in your eyes
  4 
  5 just don‘t know what to say
  6 
  7 It feels like I‘m drowning in salty water
  8 
  9 A few hours left ‘til the sun‘s gonna rise
 10 
 11 tomorrow will come an it‘s time to realize
 12 
 13 our love has finished forever
 14 
 15 how I wish to come with you
 16 
view code
1.2.1 增

单行增加

行后,append

技术分享
  1 [root@AIGE aige]# sed ‘2a This is my input‘ lirc.txt |cat -n
  2 
  3 1 I look in your eyes
  4 
  5 2 just don‘t know what to say
  6 
  7 3 This is my input
  8 
  9 4 It feels like I‘m drowning in salty water
 10 
 11 5 A few hours left ‘til the sun‘s gonna rise
 12 
 13 6 tomorrow will come an it‘s time to realize
 14 
 15 7 our love has finished forever
 16 
 17 8 how I wish to come with you
 18 
view code

$表示最后一行, $a

行前,insert

技术分享
  1 [root@AIGE aige]# sed ‘2i This is my input‘ lirc.txt |cat -n
  2 
  3 1 I look in your eyes
  4 
  5 2 This is my input
  6 
  7 3 just don‘t know what to say
  8 
  9 4 It feels like I‘m drowning in salty water
 10 
 11 5 A few hours left ‘til the sun‘s gonna rise
 12 
 13 6 tomorrow will come an it‘s time to realize
 14 
 15 7 our love has finished forever
 16 
 17 8 how I wish to come with you
 18 
view code

多行增加

技术分享
  1 [root@AIGE aige]# sed ‘2a This is my input\n This is two!!!!!!!!!!!!!‘ lirc.txt |cat -n
  2 
  3 1 I look in your eyes
  4 
  5 2 just don‘t know what to say
  6 
  7 3 This is my input
  8 
  9 4 This is two!!!!!!!!!!!!!
 10 
 11 5 It feels like I‘m drowning in salty water
 12 
 13 6 A few hours left ‘til the sun‘s gonna rise
 14 
 15 7 tomorrow will come an it‘s time to realize
 16 
 17 8 our love has finished forever
 18 
 19 9 how I wish to come with you
 20 
view code
技术分享
  1 [root@AIGE aige]# sed ‘2i This is my input\n This is two!!!!!!!!!!!!!‘ lirc.txt |cat -n
  2 
  3 1 I look in your eyes
  4 
  5 2 This is my input
  6 
  7 3 This is two!!!!!!!!!!!!!
  8 
  9 4 just don‘t know what to say
 10 
 11 5 It feels like I‘m drowning in salty water
 12 
 13 6 A few hours left ‘til the sun‘s gonna rise
 14 
 15 7 tomorrow will come an it‘s time to realize
 16 
 17 8 our love has finished forever
 18 
 19 9 how I wish to come with you
 20 
view code
1.2.2 删

sed软件可以对单行或多行文本进行处理,如果在sed命令前面不指定地址范围,那么默认会匹配所有行。

用法:n1[,n2]{sed-commands}

地址用逗号分隔,n1,n2可以用数字,正则表达式,或者二者的组合表示。

逗号:英文的。或者说任何命令都是英文的。

工作的时候尽量只使用数字的。防止删多了

地址外围

含义

10{sed-commands}

对第10行操作

10,20{sed-commands}

对10到20行操作,包括10行和20行

10,+20{sed-commands}

对10到30(10+20)行操作,包括10和20行

1~2{sed-commands}

对1,3,5基数行操作

10.$ {sed-commands}

对10到最后一行操作

/aige/{sed-commands}

对匹配aige的行操作

/aige/,/can/{sed-commands}

对匹配aige和can的行进行操作

/aige/,${sed-commands}

对匹配aige到最后一行

/aige/,10{sed-commands}

对匹配aige到往后加10行操作

1,/can/{sed-commands}

第一行到配合can的行

/aige/,+2{sed-commands}

对匹配aige的行其后的2行操作

对~的解释。

格式:“first~step”表示从first行开始,以步长step递增,等差。

技术分享
  1 [root@AIGE aige]# seq 10 |sed -n ‘1~2p‘
  2 
  3 1
  4 
  5 3
  6 
  7 5
  8 
  9 7
 10 
 11 9
 12 
view code
技术分享
  1 [root@AIGE aige]# sed ‘3,$d‘ lirc.txt 
  2 
  3 I look in your eyes
  4 
  5 just don‘t know what to say
  6 
view code

取反

技术分享
  1 [root@AIGE aige]# sed ‘2!d‘ person.txt 
  2 
  3 102,zhangyao,CTO
  4 
  5 [root@AIGE aige]#
  6 
view code
1.2.3 改

参数c:

技术分享
  1 [root@AIGE aige]# sed ‘2c This is my input‘ lirc.txt |cat -n
  2 
  3 1 I look in your eyes
  4 
  5 2 This is my input
  6 
  7 3 It feels like I‘m drowning in salty water
  8 
  9 4 A few hours left ‘til the sun‘s gonna rise
 10 
 11 5 tomorrow will come an it‘s time to realize
 12 
 13 6 our love has finished forever
 14 
 15 7 how I wish to come with you
 16 
view code
1.2.4 文本替换

选项:

“s”:单独使用->将每一行中第一处匹配的字符串进行替换。

“g”:每一行进行全部替换->sed命令s的替换标志之一(全局替换),非sed命令

“-i”:修改文件内容->sed软件的选项,注意和sed命令i区分

  1 sed -i ‘s/old/new/g‘ person.txt
  2 
  3 sed -i ‘s#old#new#g‘ person.txt
  4 

特点:

1. 两边是引号,引号里面的两边分别为s和g,中间是三个一样的字符/或#作为定界符。字符#能在替换内容包含字符/有助于区别。定界符可以是任意字符如:或|等,但当替换内容包含定界符时,需要转义既“\”。建议使用#

2. 定界符/或#,第一个和第二个之间的就是被替换的内容,第二个和第三个之间的就是替换后的内容。

3. s#old#new#g,old:能用正则表达式,但new不能用,必须具体。new,用正则- -你想换什么?

4. 默认sed软件是对模式空间(内存中的数据)操作,而-i选项会更改磁盘上的文件内容。

参数sg

技术分享
  1 [root@AIGE aige]# sed ‘s#l#TEST#‘ lirc.txt 
  2 
  3 I TESTook in your eyes
  4 
  5 just don‘t know what to say
  6 
  7 It feeTESTs like I‘m drowning in salty water
  8 
  9 [root@AIGE aige]# sed ‘s#l#TEST#g‘ lirc.txt 
 10 
 11 I TESTook in your eyes
 12 
 13 just don‘t know what to say
 14 
 15 It feeTESTs TESTike I‘m drowning in saTESTty water
 16 
 17  cat >test.txt<<EOF
 18 a
 19 b
 20 a
 21 EOF
 22 
 23 eval sed ‘s#$x#$y#g‘ test.txt 
 24 
 25 b
 26 
 27 b
 28 
 29 b
 30 
 31 [root@AIGE aige]# echo ‘`hostname -I`‘
 32 
 33 `hostname -I`
 34 
 35 [root@AIGE aige]# eval echo ‘`hostname -I`‘
 36 
 37 10.0.0.100 172.168.1.100
 38 
 39 [root@AIGE aige]#
 40 
view code

开机自启动优化:

技术分享
  1 chkconfig --list|grep 3:on|egrep -v "crond|sshd|network|rsyslog|sysstat"|awk ‘{print "chkconfig",$1,"off"}‘|bash
view code

扩展正则

技术分享
  1 [root@AIGE aige]# sed -n ‘s#\(look\)#\1#gp‘ lirc.txt 
  2 
  3 I look in your eyes
  4 
  5 [root@AIGE aige]# sed -rn ‘s#(look)#\1#gp‘ lirc.txt 
  6 
  7 I look in your eyes
  8 
view code

&代表被替换的内容

技术分享
  1 [root@AIGE aige]# sed -rn ‘s#I (.*) in#\1-------&#gp‘ lirc.txt 
  2 
  3 look-------I look in your eyes
  4 
  5 [root@AIGE aige]#
  6 
view code

批量改名:

技术分享
  1 [root@AIGE test]# ls | sed -r ‘s#(.*)(_finished)(.*)#mv & \1\3#g‘
  2 
  3 mv stu_102999_1_finished.jpg stu_102999_1.jpg
  4 
  5 mv stu_102999_2_finished.jpg stu_102999_2.jpg
  6 
  7 mv stu_102999_3_finished.jpg stu_102999_3.jpg
  8 
  9 mv stu_102999_4_finished.jpg stu_102999_4.jpg
 10 
 11 mv stu_102999_5_finished.jpg stu_102999_5.jpg
 12 
 13 rename "_finished" "" *.jpg
 14 
view code
1.2.5 查

“p”:输出指定内容,但默认会输出2次匹配的结果,因此使用-n选项取消默认输出

p:print

技术分享
  1 [root@AIGE aige]# sed -n ‘2p‘ lirc.txt 
  2 
  3 just don‘t know what to say
  4 
view code
1.2.6 扩展正则
  1 sed -rn ‘/aige|jack/‘ person.txt

正则需要//,必须用

awk的正则也一样

1.2.7 修改文件

备份文件

sed -i.ori ‘s#zhangyao#NB#‘ person.txt

sed ‘[地址范围|模式范围] s#[被替换的字符串]#[替换后的字符串]#[替换标志]‘ [输入文件]

命令说明:

1.[地址范围|模式范围]:可选项,如果没有指定,sed软件将在所有行上进行替换。

2.“s”既执行替换命令substitute

3.被替换的字符串。可以是一个正则表达式

4.替换后的字符串,只能是一个具体的内容

5.替换标志:可选项,包括前面详述的全局标志。g(global),还有数字标志。打印标志p(print),写标志w(write),忽略大小写i(ignore),执行命令标志e(excute),根据需要可以把一个或多个代替标志组合起来使用

1.2.8 另存为文件

sed ‘w newfile.txt‘ oldfile.txt

1.3 扩展

1.3.1 Ms# # #Ng:

语法说明:M N也就是坐标

Ms----对第M行处理,无G替换标志,只处理第一处,有g替换标志则对第M行全部替换

Ng---对每一行,从第N处开始替换 N范围1-512

Ms、Ng何用表示只对第M行从第N处匹配开始替换

技术分享
  1 [root@AIGE aige]# cat test 
  2 1 1 1 1 1 1 1 1
  3 1 1 1 1 1 1 1 1
  4 1 1 1 1 1 1 1 1
  5 1 1 1 1 1 1 1 1
  6 1 1 1 1 1 1 1 1
  7 1 1 1 1 1 1 1 1
  8 1 1 1 1 1 1 1 1
  9 1 1 1 1 1 1 1 1
 10 
view code
技术分享
  1 [root@AIGE aige]# sed ‘s#1#0#2g‘ test 
  2 1 0 0 0 0 0 0 0
  3 1 0 0 0 0 0 0 0
  4 1 0 0 0 0 0 0 0
  5 1 0 0 0 0 0 0 0
  6 1 0 0 0 0 0 0 0
  7 1 0 0 0 0 0 0 0
  8 1 0 0 0 0 0 0 0
  9 1 0 0 0 0 0 0 0
 10 
view code
技术分享
  1 [root@AIGE aige]# sed ‘5s#1#0#g‘ test 
  2 1 1 1 1 1 1 1 1
  3 1 1 1 1 1 1 1 1
  4 1 1 1 1 1 1 1 1
  5 1 1 1 1 1 1 1 1
  6 0 0 0 0 0 0 0 0
  7 1 1 1 1 1 1 1 1
  8 1 1 1 1 1 1 1 1
  9 1 1 1 1 1 1 1 1
 10 
view code

 

技术分享
  1 [root@AIGE aige]# sed ‘5s#1#0#5g‘ test 
  2 1 1 1 1 1 1 1 1 
  3 1 1 1 1 1 1 1 1 
  4 1 1 1 1 1 1 1 1
  5 1 1 1 1 1 1 1 1
 6 1 1 1 1 0 0 0 0
 7 1 1 1 1 1 1 1 1
 8 1 1 1 1 1 1 1 1
 9 1 1 1 1 1 1 1 1
view code

 

忽略大小写

sed ‘s#old#new#gi‘ test.txt

获取行号

技术分享
  1 [root@AIGE aige]# sed "=" lirc.txt |sed ‘N;s#\n# #‘
  2 1 I look in your eyes
  3 2 just don‘t know what to say
  4 3 It feels like I‘m drowning in salty water
  5 4 A few hours left ‘til the sun‘s gonna rise
  6 5 tomorrow will come an it‘s time to realize
  7 6 our love has finished forever
  8 7 how I wish to come with you
  9 
view code
1.3.2 一条sed语句执行多条命令

-e:

sed -e ‘3,$d‘ -e ‘s#10#01#‘ person.txt

分号;

sed ‘3,$d;s#10#01#‘ person.txt

-f:指定一个文件person.sed里的内容来做sed命令

[root@AIGE aige]# cat person.sed

3,$d

s#10#01#g

[root@AIGE aige]# sed -f person.sed person.txt

011,oldboy,CEO

012,zhangyao,CTO

1.3.3 一些联系和{}用法
技术分享
  1 [root@AIGE aige]# wc -l lirc.txt 
  2 7 lirc.txt
  3 [root@AIGE aige]# sed -n "$=" lirc.txt 
  4 7
  5 [root@AIGE aige]#
  6 [root@AIGE sed-4.2.1]# sed -n ‘5p;50p;60p‘ /etc/services 
  7 # IANA services version: last updated 2009-11-10
  8 # 24 - private mail system
  9 nameserver 42/udp name # IEN 116
 10 
view code

{}可以把多个命令括起来,用来处理单个地址或者地址范围

技术分享
  1 [root@AIGE aige]# sed -n ‘2,3{p;=}‘ person.txt 
  2 102,zhangyao,CTO
  3 2
  4 103,Alex,COO
  5 3
  6 
view code

1.4 保持空间两个命令

1.4.1 命令n

命令n的作用:清空当前模式空间的内容,然后从输入文件中读取下一行。如果在命令行执行过程中遇到n,那么它会改变正常的执行流程。(读取数据,执行命令,打印输出,重复循环)

[root@AIGE aige]# sed -n ‘n;p‘ person.txt

102,zhangyao,CTO

104,yy,CFO

1.4.2 命令N

命令N的作用:不会清空模式空间的内容,并且从输入文件中读取下一行的数据,追加到模式空间中,两行数据换行符\n连接。

反转:

技术分享
  1 [root@AIGE aige]# rev person.txt
  2 OEC,yobdlo,101
  3 OTC,oaygnahz,201
  4 OOC,xelA,301
  5 OFC,yy,401
  6 OIC,euxief,501
  7 [root@AIGE aige]# tac person.txt
  8 105,feixue,CIO
  9 104,yy,CFO
 10 103,Alex,COO
 11 102,zhangyao,CTO
 12 101,oldboy,CEO
 13 [root@AIGE aige]# sed -n ‘1!G;h;$p‘ person.txt
 14 105,feixue,CIO
 15 104,yy,CFO
 16 103,Alex,COO
 17 102,zhangyao,CTO
 18 101,oldboy,CEO
view code

1.5 sedsed调试工具

软件官网: http://aurelio.net/projects/sedsed/。

wget  http://sedsed.sourceforge.net/sedsed-1.0 -O /bin/sedsed

chmod +x /bin/sedsed

[root@AIGE aige]# sedsed -d --hide=hold -n ‘2,3p;=‘ person.txt

选项

解释说明

-d

开启调试模式

--hide

隐藏一些调试信息,选项有:PATT,HOLD,COMM

PATT是pattern模式的缩写,既模式空间

HOLD是保持空间

COMM是command的缩写,既sed命令

-n

取消默认输出

$

这个符号正则表示文件的结尾。如果文件的开头是$,则表示空行

12-sed命令详解