首页 > 代码库 > Linux shell文本过滤

Linux shell文本过滤

正则表达式
--概念:一种用来描述文本模式的特殊语法
--由普通字符(例如:字符a到z),以及特殊字符(元字符,如/*?等)组成匹配的字符串
--文本过滤工具在某种模式之下,都支持正则表达式
--基本元字符集及其含义
    ^    只匹配行首
    $    只匹配行尾
    *    一个单字符后紧跟*,匹配0个或多个此单字符
    []    匹配[]内字符。可以使一个单字符,也可以是字符序列。可以使用"-"表示[]内字符序列范围,如用[1-5]代替[12345]
    \    用来屏蔽一个元字符的特殊含义。因为有时在shell中一些元字符有特殊含义。"\"可以使其失去应有意义
    .    匹配任意单字符
    pattern\{n\}    用来匹配pattern出现次数,n为次数,(这里的大括号需要转义,和javascript不同)
    pattern\{n,\}    含义同上,但次数最少为n
    pattern\{n,m\}    含义同上,但pattern出现次数在n与m之间
--特殊:"^$"匹配空行    "^.$"匹配包含一个字符的行
--shell中似乎没有javascript中的\S,\w等元字符

 

Linux shell文本过滤