首页 > 代码库 > sed的用法

sed的用法

1、什么是sed

sed命令是一个流线式、非交互式编辑器,可以实现在vi等编辑器中一样的编辑效果。

2、sed的工作原理

模式空间(pattern space)
sed一次处理一行文本(或输入),并把输出送往屏幕或重定向到文件。
sed把当前处理的行存储在临时缓冲区中,称为模式空间。
一旦完成对模式空间中的行的处理,也就是执行完这一行中的sed命令,模式空间中的行就被送往屏幕(除非是删除行命令或者打印到打印机)。
行被处理完后,就被移出模式空间,程序接着读入下一行,处理、显示、移出......直到文件的最后一行处理完以后sed结束。

保持缓冲区(holding buffer)
h命令将模式空间中的行复制到一个叫保持缓冲区的特殊缓冲区中。
G命令将保持缓冲区中的行放回模式空间中,且追加到模式空间中已有行的末尾。
g命令将保持缓冲区中的行放回模式空间中,且替换模式空间中已有的行。
x命令互换模式空间和保持缓冲区的内容。

注意:保持缓冲区一次只能容纳一行。

3、定址

通过定址来判断哪一行希望被编辑。
可以通过数字、正则表达式或者二者结合的方式来定址。
在没有定址的情况下,sed处理输入文件的所有行。
$sed ‘1,3d‘ myfile
$sed -n ‘/John/p‘

4、命令和选项

命令:
a\ 在当前行后面加入一行或者文本
i\ 在当前行前面插入一行
d 从模式空间中删除匹配的行
p 打印匹配模板的行
r file 从file中读行
h 拷贝模板块的内容到内存中的缓冲区
G 命令将保持缓冲区中的行放回模式空间中,且追加到模式空间中已有行的末尾
g 命令将保持缓冲区中的行放回模式空间中,且替换模式空间中已有的行
q 退出sed
! 表示后面的命令对所有没有被选定的行发生作用
s/re/string 用string替换正则表达式re匹配的字符串

替换标记:
g 行内全面替换
w 写入文件

选项:
-e command 允许多点编辑
--expression command 允许多点编辑
-n 取消默认输出

5、sed支持的特殊元字符

& 保存搜索字符用来替换其他字符 s/love/&/ 将love替换为love

6、sed脚本

就是一个包含sed命令清单的文件,好处是不必担心与shell命令行的交互问题,不需要引用sed命令来防止它被shell解释。
sed对于脚本中输入的命令非常挑剔,在命令的末尾不能有任何空白或者文本。
$sed -f script.sh datafile

7、实例

1)p命令
$sed -n ‘/north/p‘ datafile //-n和p命令一般一块使用,用来只打印匹配模板的行,取消默认打印模式空间中的所有行的行为

2)删除:d命令
$sed ‘3d‘ datafile //删除第3行
$sed ‘3,$‘ datafile //删除第3到最后一行

3)替换:s命令
$sed ‘s/west/north/g‘ datafile //如果没有g标志,则只替换第1个匹配的
$sed -n ‘s/west/north/gp‘ datafile //-n和p命令只打印发生替换的行
$sed ‘s/[0-9][0-9]$/&.5/‘ datafile //&表示替换字符串中被找到的部分
$sed -n ‘s/\(Mar\)got/\1ianne/p‘ datafile //标记
$sed ‘s#west#east#g‘ //s后面的字符是分隔搜索字符串和替换字符串的字符,默认是/,但在s命令情况下可以改变,无论什么字符紧跟着s命令被认为是新的分隔符。

4)选定行的范围:,
$sed -n ‘/west/,/east/p‘ datafile //打印west和east之间的行。如果west未找到,则不打印任何行;如果east未找到,则打印west到末尾的所有行。
$sed ‘/west/,/east/s/$/VAR*/‘ datafile

5)多点编辑:e命令
$sed -e ‘1,3d‘ -e ‘s/Hemenway/Jones/‘ datafile //多个命令是在同一行执行,命令的执行顺序影响命令的结果。
$sed --expression=‘s/TB/Tobias/‘ --expression=‘/north/d‘ datafile

6)从文件读入:r命令
$sed ‘/Suan/r newfile‘ datafile //从文件读入的内容显示在所有匹配行的后面

7)写入文件:w命令
$sed -n ‘‘/north/w newfile‘ datafile //将模板匹配的行写入文件

8)追加命令:a命令
$sed -n ‘/^north/a\
----->The North Sales Distribute Has Moved<------------‘ datafile

$sed -n ‘/^north/a\
----->The North Sales Distribute Has Moved<------------\
----->The North Sales Distribute Has Moved<------------‘ datafile //追加多行,除了最后一行,每一行需要加\

9)插入:i命令
$sed -n ‘/^north/i\
----->The North Sales Distribute Has Moved<------------‘ datafile

$sed -n ‘/^north/i\
----->The North Sales Distribute Has Moved<------------\
----->The North Sales Distribute Has Moved<------------‘ datafile //在匹配行之前插入多行,除了最后一行,每一行需要加\

10)下一个:n命令
$sed ‘/eastern /{n; s/AM/Archie/; }‘ datafile

11)变形:y命令
$sed ‘1,3y/abcdefg/ABCDEFG/‘ datafile //将a-g变换为大写,定址部分可使用正则表达式

12)退出:q命令
$sed ‘5q‘ datafile //打印第5行之后退出
$sed ‘/Lewis/{ s/Lewis/Jooseph/;q } //{ }执行多个命令,分号分隔,可嵌套

13)保持和获取:h命令、G命令、g命令
$sed -e ‘/northeast/h‘ -e ‘$G‘ datafile //将含northeast的行追加到文件的最后一行
$sed -e ‘/WE/{h, d; }‘ -e ‘/CT/{G;}‘ datafile //将包含WE的行移动到包含CT的行的后面
$sed -e ‘/northeast/h‘ -e ‘$g‘ datafile //将含northeast的行替换文件的最后一行

14)保持和互换
$sed -e ‘/particia/h‘ -e ‘/Margot/x‘ datafile //包含Margot的行被包含particia的行替换了

15)其它实例
查找包含字符串的行
#sed -n ‘/^vmm_read_interval/p‘ log2.txt >avg2.txt                  //-n和/p命令一般配合使用,只打印找到的行

删除文件中的空行
#sed ‘/^$/d‘ file

针对已查找到的内容进行替换
#sed ‘s/^[1-9]/\n&/g‘ 2.srt>3.srt    //在以数字开头的行前加一个空行
#sed ‘s/[0-9][0-9]$/&.5/‘ datafile     //以两位数结尾行加.5
#sed ‘s/address/&#/g‘ /etc/network/interfaces       //在所有address后加#
#sed ‘s/:.*[0-9]$g‘          将冒号以及冒号后的数字替换成空
注意:
1)&符号替换字符串中被找到的部分,不是指找到部分所在的整行
2)/g表示命令作用的范围为整行,即对一行中所有找到的内容执行相应动作,否则只针对第一次找到的内容

多点编辑
#sed -e ‘s/address/#&/‘ -e ‘s/netmask/#&/‘ -e ‘s/gateway/#&/g‘ -e ‘s/^##//g‘ $NET_CONFIG_FILE.bak >$NET_CONFIG_FILE 
//首先在所有address,netmask,gateway单词前加一个#,再针对以两个#开头的行中将两个#去掉,从前往后依次执行。

合并两行
1) 先将每一行的开头用一特殊的字符串标记,例如BBBB
2) 将需要合并的行的前一行末尾用一特殊的字符串标记,例如AAAA
3) 用tr删除所有回车换行符\n,则所有行合成一行。真正需要合并的行之间会存在AAAABBBB的标记,需要换行的地方有BBBB的标记
4) 将所有AAAABBBB替换成空
5) 将所有BBBB替换成‘\n   ’
具体程序如下:
sed ‘1,$s/^/BBBB/g‘ $1.1 >$1.2
sed ‘/[^。)?”!〗]$/s/$/AAAA/‘ $1.2 >$1.3
sed -n ‘1,$p‘ $1.3|tr -d ‘\n‘>$1.4
sed ‘s/AAAABBBB//g‘ $1.4>$1.5
sed ‘s/BBBB/\n    /g‘ $1.5>$1.6
sed ‘s/AAAA//g‘ $1.6>$1.7
cp $1.7 $1.txt
echo "finished."
rm $1.[0-9]*

将中英文字幕文件分成中文和英文两个字幕文件
$sed ‘/^[0-9][0-9]:/{n;d}‘ 1.srt >2.srt
$sed ‘/^[0-9][0-9]:/{n;n;d}‘ 1.srt >3.srt

=-=-=-=-=
Powered by Blogilo

sed的用法