首页 > 代码库 > Linux文本处理三剑客之sed

Linux文本处理三剑客之sed

 
1.sed简介

     sed是文本处理命令,因为其强大的功能而可称之为一种数据流编辑器。sed 对文本的处理很强大,并且sed非常小,参数少,容易掌握,他的操作方式根awk
有点像。sed 一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,
称为“模式空间”pattern space),接着用sed命令处理缓冲区中的内容,处理完
成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。
文件内容并没有 改变,除非你使用重定向存储输出。Sed主要用来自动编辑一个或
多个文件;简化对文件的反复操作;简单的将,sed可以对文进中的每一行内容进
行增删改查等操作。
2. 定址   
       可以通过定址来定位你所希望编辑的行,该地址用数字构成,用逗号分隔的两
个行数表示以这两行为起止的行的范围(包括行数表示的那两行)。如1,3表示1
,2,3行,美元符号($)表示最后一行。范围可以通过数据,正则表达式或者二者
结合的方式确定 。

3.常用选项:
  -n∶使用安静(silent)模式。在一般 sed 的用法中,所有来自 STDIN的资料一般
       都会被列出到萤幕上。但如果加上 -n 参数后,则只有经过sed 特殊处理的那
       一行(或者动作)才会被列出来。
  -e∶允许在同一行里执行多条命令。
  -f∶直接将 sed 的动作写在一个档案内, -f filename 则可以执行 filename 内
      的sed 动作;
  -r∶sed 的动作支援的是延伸型正规表示法的语法。(预设是基础正规表示法语法)
  -i∶直接修改读取的档案内容,而不是由屏幕输出。      
4.常用命令:

       a   ∶新增, a 的后面可以接字串,而这些字串会在新的一行出现(目前的下一行)
       c   ∶取代, c 的后面可以接字串,这些字串可以取代 n1,n2 之间的行!
       d   ∶删除,因为是删除啊,所以 d 后面通常不接任何咚咚;
        i   ∶插入, i 的后面可以接字串,而这些字串会在新的一行出现(目前的上一行)
        p  ∶列印,亦即将某个选择的资料印出。通常 p 会与参数 sed -n 一起运作~
        s  ∶取代,可以直接进行取代的工作哩!通常这个 s 的动作可以搭配正规表示
        法!例如 1,20s/old/new/g 就是啦!
5. 元字符集
   ^  锚定行的开始 如:/^sed/匹配所有以sed开头的行。  
   $  锚定行的结束 如:/sed$/匹配所有以sed结尾的行。  
   .  匹配一个非换行符的字符 如:/s.d/匹配s后接一个任意字符,然后是d。  
   *  匹配零或多个字符 如:/*sed/匹配所有模板是一个或多个空格后紧跟sed的行。  
    [] 匹配一个指定范围内的字符,如/[Ss]ed/匹配sed和Sed。  
   [^] 匹配一个不在指定范围内的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z
          的一个字母开头,紧跟ed的行。  
   \(..\) 保存匹配的字符,如s/\(love\)able/\1rs,loveable被替换成lovers。  
   & 保存搜索字符用来替换其他字符,如s/love/**&**/,love这成**love**。  
   \<  锚定单词的开始,如:/\<love/匹配包含以love开头的单词的行。  
   \>  锚定单词的结束,如/love\>/匹配包含以love结尾的单词的行。  
   x\{m\}  重复字符x,m次,如:/0\{5\}/匹配包含5个o的行。  
   x\{m,\}  重复字符x,至少m次,如:/o\{5,\}/匹配至少有5个o的行。  
   x\{m,n\}  重复字符x,至少m次,不多于n次,如:/o\{5,10\}/匹配5--10个o
                   的行。  

6.例1
   $ sed -e ‘/test/h‘ -e ‘$G example-----           在sed处理文件的时候,每一行都被保存在一个叫模式空间的临时缓冲区中,
   除非行被删除或者输出被取消,否则所有被处理的行都将 打印在屏幕上。接着模
   式空间被清空,并存入新的一行等待处理。在这个例子里,匹配test的行被找到
   后,将存入模式空间,h命令将其复制并存入一个称为保 持缓存区的特殊缓冲区    内。第二条语句的意思是,当到达最后一行后,G命令取出保持缓冲区的行,然
   后把它放回模式空间中,且追加到现在已经存在于模式空间中 的行的末尾。在这    
   个例子中就是追加到最后一行。简单来说,任何包含test的行都被复制并追加到
   该文件的末尾。  
   $   sed -i ‘/匹配字符串/s/替换源字符串/替换目标字符串/g‘ filename
      例2
      举例:(假设我们有一文件名为ab)
    删除某行
    [root@localhost ruby] # sed ‘1d‘ ab              #删除第一行
    [root@localhost ruby] # sed ‘$d‘ ab              #删除最后一行
    [root@localhost ruby] # sed ‘1,2d‘ ab           #删除第一行到第二行
    [root@localhost ruby] # sed ‘2,$d‘ ab           #删除第二行到最后一行
  显示某行
.    [root@localhost ruby] # sed -n ‘1p‘ ab           #显示第一行
    [root@localhost ruby] # sed -n ‘$p‘ ab           #显示最后一行
    [root@localhost ruby] # sed -n ‘1,2p‘ ab        #显示第一行到第二行
    [root@localhost ruby] # sed -n ‘2,$p‘ ab        #显示第二行到最后一行
                                         使用模式进行查询
    [root@localhost ruby] # sed -n ‘/ruby/p‘ ab    #查询包括关键字ruby所
                                              在所有行
    [root@localhost ruby] # sed -n ‘/\$/p‘ ab        #查询包括关键字$所在所
                                             有行,使用反斜线\屏蔽特殊含义


本文出自 “技术人生,简单不简单” 博客,请务必保留此出处http://willis.blog.51cto.com/11907152/1845886

Linux文本处理三剑客之sed