首页 > 代码库 > linux文本处理之常用正则表达式整理
linux文本处理之常用正则表达式整理
^ 行首。
$行尾。
. 除换行符之外任意一个字符。
* 前面的字符重复0到多次。
.*用于匹配所有字符。
[]定义一组字符,匹配组内任一一个字符(注意!只是组内的一个!)
[^] 对字符组内的字符做取反操作(不包涵组内任一一个字符)
^[] 组内字符串开头的行。
^[^] 非组内字符串开头的行。
[a-z] 匹配一个小写字母。
[A-Z] 匹配一个大写字母。
[a-Z] 匹配一个小写和大写字母。
[0-9] 匹配一个0-9的数字。
\< 匹配单词头
\> 匹配单词尾
(单词在正则中的定义,就是以空格或者其他特殊字符做分割,连续的字符串会被当做单词。)
拓展正则:
? 前字符匹配0个或1个
+前字符匹配1个或多个
|逻辑或,例如abc|def abc或def
()小括号,用于分组,例:a(bc|de)f
意思就是abcf或adef。
s{n} s重复了n次。
s{n,} s至少重复了n次,甚至更多次。
s{n,m} s至少重复了n次,最多重复m次。
posix定义的字符分类:
[:alnum:] Alphanumeric characters.
匹配范围为 [a-zA-Z0-9]
[:alpha:] Alphabetic characters.
匹配范围为 [a-zA-Z]
[:blank:] Space or tab characters.
匹配范围为 空格和TAB键
[:cntrl:] Control characters.
匹配控制键 例如 ^M 要按 ctrl+v 再按回车 才能输出
[:digit:] Numeric characters.
匹配所有数字 [0-9]
[:graph:] Characters that are both printable and visible. (A space is print-
able, but not visible, while an a is both.)
匹配所有可见字符 但不包含空格和TAB 就是你在文本文档中按键盘上能用眼睛观察到的所有符号
[:lower:] Lower-case alphabetic characters.
小写 [a-z]
[:print:] Printable characters (characters that are not control characters.)
匹配所有可见字符 包括空格和TAB
能打印到纸上的所有符号
[:punct:] Punctuation characters (characters that are not letter, digits, con-
trol characters, or space characters).
特殊输入符号 +-=)(*&^%$#@!~`|\"‘{}[]:;?/>.<,
注意它不包含空格和TAB
这个集合不等于^[a-zA-Z0-9]
[:space:] Space characters (such as space, tab, and formfeed, to name a few).
[:upper:] Upper-case alphabetic characters.
大写 [A-Z]
[:xdigit:] Characters that are hexadecimal digits.
16进制数 [0-f]
使用方法:
[root@seker ~]# grep --color ‘[[:alnum:]]‘ /etc/passwd
本文出自 “reBiRTH” 博客,请务必保留此出处http://suhaozhi.blog.51cto.com/7272298/1909379
linux文本处理之常用正则表达式整理