基础正则表达式

2024-08-11 06:46:14 219人阅读

基础正则表达式：元字符意义 BRE （basic regular expression）

正则表达式实际就是一些特殊字符，赋予了它特定的含义。

1）^word 匹配以word开头的内容。vi、vim编辑器里^代表一行的开头

2）word$ 匹配以word结尾的内容。vi、vim编辑器里^代表一行的结尾

3) ^$ 表示空行，

4） . 代表且只能代表任意一个字符。不匹配空行

5) \ 例\.就只代表点本身，转义符号，让有特殊身份意义的字符，脱掉马甲，还原本身

6) * 重复0个或多个前面的一个字符，例 0* 匹配有任意多个0 的行

7) .* 匹配所有字符。延伸 ^.* 以任意多个字符开头。 .*$以任意多个而字符结尾

8）[abc] 匹配字符集合内的任意一个字符[a-zA-Z],[0-9]

9）[^abc] 匹配不包含^后的任意一个字符的内容。

中括号里的^为取反，注意和中括号外面以。。。开头区别开来

10） a \{n,m\} 重复n到m次，前一个重复的字符，如果用egrep/sed -r 可以去掉斜线

a\{n,\} 重复至少n次，前一个重复的字符。如果用egrep/ sed -r 可以去掉斜线

a\{n\} 重复n次，前一个重复的字符。如果用egrep/ sed -r 可以去掉斜线

a\{,m\} 重复至多m次

注意：egrep或sed -r 过滤一般特殊字符可以不转义。

正则表达式	描述	示例
\	转义符，将特殊字符进行转义，忽略其特殊意义	a\.b匹配a.b，但不能匹配ajb，.被转义为特殊意义
^	匹配行首，awk中，^则是匹配字符串的开始	^tux匹配以tux开头的行
$	匹配行尾，awk中，$则是匹配字符串的结尾	tux$匹配以tux结尾的行
.	匹配除换行符\n之外的任意单个字符，awk则中可以	ab.匹配abc或bad，不可匹配abcd或abde，只能匹配单字符
[ ]	匹配包含在[字符]之中的任意一个字符	coo[kl]可以匹配cook或cool
[^ ]	匹配[^字符]之外的任意一个字符	123[^45]不可以匹配1234或1235，1236、1237都可以
[ - ]	匹配[]中指定范围内的任意一个字符，要写成递增	[0-9]可以匹配1、2或3等其中任意一个数字
?	匹配之前的项1次或者0次	colou?r可以匹配color或者colour，不能匹配colouur
+	匹配之前的项1次或者多次	sa-6+匹配sa-6、sa-666，不能匹配sa-
*	匹配之前的项0次或者多次	co*l匹配cl、col、cool、coool等
()	匹配表达式，创建一个用于匹配的子串	ma(tri)?匹配max或maxtrix
{ n }	匹配之前的项n次，n是可以为0的正整数	[0-9]{3}匹配任意一个三位数，可以扩展为[0-9][0-9][0-9]
{n,}	之前的项至少需要匹配n次	[0-9]{2,}匹配任意一个两位数或更多位数
{n,m}	指定之前的项至少匹配n次，最多匹配m次，n<=m	[0-9]{2,5}匹配从两位数到五位数之间的任意一个数字
\|	交替匹配\|两边的任意一项	ab(c\|d)匹配abc或abd

POSIX字符类

POSIX字符类是一个形如[:...:]的特殊元序列（meta sequence），他可以用于匹配特定的字符范围。

元字符

元字符（meta character）是一种Perl风格的正则表达式，只有一部分文本处理工具支持它，并不是所有的文本处理工具都支持。

基础正则表达式

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们