Linux命令中使用正则表达式

首页 > 代码库 > Linux命令中使用正则表达式

Linux命令中使用正则表达式

2024-08-13 08:51:40 220人阅读

在使用grep、awk和sed命令时，需要使用正则表达式。
比如我通过grep找代码编译结果中是否有错误。或者是否有我代码的错误。
这里说下正则表达式基本的应用：

匹配行首与行尾。
匹配数据集。
只匹配字母和数字。
匹配一定范围内的字符串集。

^	只匹配行首
$	只匹配行尾
*	一个单字符后紧跟*，匹配0个或多个此单字符
[]	匹配[]内字符，可以是一个单字符，也可以是字符序列。可以使用 - 表示[]内字符序列范围，如用[1-5]代替[12345]
\	用来屏蔽一个元字符的特殊含义。因为有时在shell中一些元字符有特殊含义。\可以使其失去应有含义。
.	匹配任意单字符
pattern\{n\}	用来匹配前面pattern出现次数。n为次数
pattern\{n,\}	含义同上，但次数最少为n
patter\{n,m\}	含义同上，但pattern出现次数在n与m之间

使用句点匹配单字符
句点“.”可以匹配任意单字符。例如，如果要匹配一个字符串，以be g开头，中间夹一个
任意字符，那么可以表示为be g . n，“.”可以匹配字符串头，也可以是中间任意字符。
在ls-l命令中，可以匹配一定权限：
.. . x . . x . . x
此格式匹配用户本身，用户组及其他组成员的执行权限。
~$ ls -l |grep ...x..x..x
drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 bin
drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:06 emacs
drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 etc
drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 info
drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 leim
drwxrwxrwx 1 h00209633 Domain U 0 二月 7 09:05 lisp
drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:07 site-lisp
~$
在行首以^匹配字符串或字符序列
^只允许在一行的开始匹配字符或单词。例如，使用ls-l命令，并匹配目录。之所以可以
这样做是因为ls-l命令结果每行第一个字符是d，即代表一个目录。
~$ ls -l |grep ^d
drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 bin
drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:06 emacs
drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 etc
drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 info
drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 leim
drwxrwxrwx 1 h00209633 Domain U 0 二月 7 09:05 lisp
drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:07 site-lisp
在行尾以$匹配字符串或字符
可以说$与^正相反，它在行尾匹配字符串或字符，$符号放在匹配单词后。假定要匹配以
单词lisp结尾的所有行，操作为：
~$ ls |grep sp$
lisp
site-lisp
~$
使用*匹配字符串中的单字符或其重复序列
使用此特殊字符匹配任意字符或字符串的重复多次表达式。例如：
找e*m（以e开头m结束的字符串）
~$ ls | grep e*m
emacs
leim
~$
使用\屏蔽一个特殊字符的含义
有时需要查找一些字符或字符串，而它们包含了系统指定为特殊字符的一个字符。什么
是特殊字符？一般意义上讲，下列字符可以认为是特殊字符：
$ . ‘ " * [ ] ^ | { } \ + ?
例如：找以.el后缀的文件
~/lisp$ ls | grep \.el$
abbrev.el
abbrevlist.el
add-log.el
align.el
allout.el
ansi-color.el
apropos.el
arc-mode.el
array.el
autoarg.el
autoinsert.el
autorevert.el
avoid.el
battery.el
bindings.el
bookmark.el
bs.el
buff-menu.el
button.el
calculator.el
case-table.el
使用[]匹配一个范围或集合
使用[]匹配特定字符串或字符串集，可以用逗号将括弧内要匹配的不同字符串分开，但并
不强制要求这样做（一些系统提倡在复杂的表达式中使用逗号），这样做可以增加模式的可读
性。
使用“-”表示一个字符串范围，表明字符串范围从“-”左边字符开始，到“-”右边字
符结束。
如果熟知一个字符串匹配操作，应经常使用[]模式。
假定要匹配任意一个数字，可以使用：
[0123456789]
然而，通过使用“-”符号可以简化操作：
[0-9]
或任意小写字母
[a-z]
要匹配任意字母，则使用：
[A-Za-z]
表明从A-Z、a-z的字母范围。
如要匹配任意字母或数字，模式如下：
[A-Za-z0-9]
注意^符号的使用，当直接用在第一个括号里，意指否定或不匹配括号里内容。
[^a-zA-Z]
匹配任一非字母型字符，而
[^0-9]
匹配任一非数字型字符。
通过最后一个例子，应可猜知除了使用^，还有一些方法用来搜索任意一个特殊字符。
使用\{\}匹配模式结果出现的次数
使用*可匹配所有匹配结果任意次，但如果只要指定次数，就应使用\{ \ }，此模式有三种
形式，即：
pattern\{n\}匹配模式出现n次。
pattern\{n,\}匹配模式出现最少n次。
pattern\{n,m}匹配模式出现n到m次之间，n , m为0 - 2 5 5中任意整数。
例如格式如下：前4个字符是数字，接下来是xx，最后4个也是数字，
操作如下：
[0-9]\{4\}XX[0-9]\{4\}
具体含义如下：
1)匹配数字出现4次。
2)后跟代码xx。
3)最后是数字出现4次。

经常使用的正则表达式举例

^ 行首

$ 行尾

^ [ t h e ] 以t h e开头行

[ S s ] i g n a [ l L ] 匹配单词s i g n a l、s i g n a L、S i g n a l、S i g n a L

[Ss]igna[lL]". 同上，但加一句点

[ m a y M A Y ] 包含m a y大写或小写字母的行

^ U S E R $ 只包含U S E R的行

[tty]$ 以t t y结尾的行

" . 带句点的行

^ d . . x . . x . . x 对用户、用户组及其他用户组成员有可执行权限的目录

^ [ ^ l ] 排除关联目录的目录列表

^[^d] ls –l | grep ^[^d] 只显示非文件夹的文件

[ . * 0 ] 0之前或之后加任意字符

[ 0 0 0 * ] 0 0 0或更多个

[ iI] 大写或小写I

[ i I ] [ n N ] 大写或小写i或n

[ ^ $ ] 空行

[ ^ . * $ ] 匹配行中任意字符串

^ . . . . . . $ 包括6个字符的行

[a- zA-Z] 任意单字符

[ a - z ] [ a - z ] * 至少一个小写字母

[ ^ 0 - 9 " $ ] 非数字或美元标识

[ ^ 0 - 0 A - Z a - z ] 非数字或字母

[ 1 2 3 ] 1到3中一个数字

[ D d ] e v i c e 单词d e v i c e或D e v i c e

D e . . c e 前两个字母为D e，后跟两个任意字符，最后为c e

" ^ q 以^ q开始行

^ . $ 仅有一个字符的行

^".[0-9][0-9] 以一个句点和两个数字开始的行

‘ " D e v i c e " ‘ 单词d e v i c e

D e [ V v ] i c e " . 单词D e v i c e或d e v i c e

[ 0 - 9 ] " { 2 " } - [ 0 - 9 ] " { 2 " } - [ 0 - 9 ] " { 4 " } 对日期格式d d - m m - y y y y

[ 0 - 9 ] " { 3 " } " . [ 0 - 9 ] " { 3 " } " . [ 0 - 9 ] " { 3 " } " . [ 0 - 9 ] " { 3 " } I P地址格式

[ ^ . * $ ] 匹配任意行

[A-Za-z]* 匹配所有单词

常用的g r e p选项

-c 只输出匹配行的计数。

-i 不区分大小写（只适用于单字符）。

-h 查询多文件时不显示文件名。

-l 查询多文件时只输出包含匹配字符的文件名。

-n 显示匹配行及行号。

-s 不显示不存在或无匹配文本的错误信息。

-v 显示不包含匹配文本的所有行。

本文出自 “shisen” 博客，请务必保留此出处http://shisen.blog.51cto.com/11862607/1852700

Linux命令中使用正则表达式

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > Linux命令中使用正则表达式

Linux命令中使用正则表达式

看完仍有疑问？有类似问题直接问程序猿