linux文本处理之常用正则表达式整理

首页 > 代码库 > linux文本处理之常用正则表达式整理

linux文本处理之常用正则表达式整理

2024-09-10 02:05:54 219人阅读

^ 行首。

$行尾。

. 除换行符之外任意一个字符。

* 前面的字符重复0到多次。

.*用于匹配所有字符。

[]定义一组字符，匹配组内任一一个字符（注意！只是组内的一个！）

[^] 对字符组内的字符做取反操作（不包涵组内任一一个字符）

^[] 组内字符串开头的行。

^[^] 非组内字符串开头的行。

[a-z] 匹配一个小写字母。

[A-Z] 匹配一个大写字母。

[a-Z] 匹配一个小写和大写字母。

[0-9] 匹配一个0-9的数字。

\< 匹配单词头

\> 匹配单词尾

（单词在正则中的定义，就是以空格或者其他特殊字符做分割，连续的字符串会被当做单词。）

拓展正则：

? 前字符匹配0个或1个

+前字符匹配1个或多个

｜逻辑或，例如abc｜def abc或def

()小括号，用于分组,例：a（bc｜de）f

意思就是abcf或adef。

s{n} s重复了n次。

s{n,} s至少重复了n次，甚至更多次。

s{n,m} s至少重复了n次，最多重复m次。

posix定义的字符分类：

[:alnum:] Alphanumeric characters.

匹配范围为 [a-zA-Z0-9]

[:alpha:] Alphabetic characters.

匹配范围为 [a-zA-Z]

[:blank:] Space or tab characters.

匹配范围为空格和TAB键

[:cntrl:] Control characters.

匹配控制键例如 ^M 要按 ctrl+v 再按回车才能输出

[:digit:] Numeric characters.

匹配所有数字 [0-9]

[:graph:] Characters that are both printable and visible. (A space is print-

able, but not visible, while an a is both.)

匹配所有可见字符但不包含空格和TAB 就是你在文本文档中按键盘上能用眼睛观察到的所有符号

[:lower:] Lower-case alphabetic characters.

小写 [a-z]

[:print:] Printable characters (characters that are not control characters.)

匹配所有可见字符包括空格和TAB

能打印到纸上的所有符号

[:punct:] Punctuation characters (characters that are not letter, digits, con-

trol characters, or space characters).

特殊输入符号 +-=)(*&^%$#@!~`|\"‘{}[]:;?/>.<,

注意它不包含空格和TAB

这个集合不等于^[a-zA-Z0-9]

[:space:] Space characters (such as space, tab, and formfeed, to name a few).

[:upper:] Upper-case alphabetic characters.

大写 [A-Z]

[:xdigit:] Characters that are hexadecimal digits.

16进制数 [0-f]

使用方法:

[root@seker ~]# grep --color ‘[[:alnum:]]‘ /etc/passwd

本文出自 “reBiRTH” 博客，请务必保留此出处http://suhaozhi.blog.51cto.com/7272298/1909379

linux文本处理之常用正则表达式整理

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > linux文本处理之常用正则表达式整理

linux文本处理之常用正则表达式整理

看完仍有疑问？有类似问题直接问程序猿