Linux正則表達式-定位元字符

首页 > 代码库 > Linux正則表達式-定位元字符

Linux正則表達式-定位元字符

2024-10-17 17:02:01 213人阅读

有两个元字符用于指定字符串出如今行首或行末。脱字符(^)是指示開始的单字符正則表達式。美元符号($)是指示行结尾的单字符的正則表達式。这些通常称为"定位符"，由于它们将匹配限定在特定位置。比如，能够使用下面表达式打印以First開始的行：
^First
没有^元字符。这个表达式将打印包括First的随意行。

通常。使用VI输入要由troff处理的文本，而且不想让空格出如今行的结尾。假设想找到(并删除)它们，以下的正則表達式能够匹配在结尾处有一个或多个空格的行：
□□*$

Troff请求和宏必须在行的開始处输入。它们是两个字符的字符串。前面带有一个句点。

假设请求或宏有一个參数。那么它通常后面跟有一个空格。用于搜索这种请求的正則表達式是：
^\...□

这个表达式匹配"行首有一个句点，随后跟有两个字符的字符串，然后是一个空格的行"。
能够使用两个连续的定位元字符来匹配空行，即：^$

能够使用这样的模式计算文件里的空行数，在grep中使用计数选项-c：

$ grep -c ‘^$‘ ch04
5

假设想使用sed来删除空行。那么这个正則表達式非常实用。

以下的正則表達式可用于匹配空行，即使当中包括空格：
^□*$

相同。能够使用下面表达式匹配整个行：^.*$

在sed(和grep) 中，仅仅有当"^"和"$"分别出如今正則表達式的開始或结尾时才是特殊的。

因此"^abc"意味着"匹配仅仅处于行的開始处的字母a、b和c" ，而"ab^c" 意味着"匹配处于行的任何位置的a、b、字符^，然后是c"。

这对于"$"相同使用。

在awk中则不同。 "^"和"$"总是特殊的。即使它们可能使编写的正則表達式不匹配不论什么东西。

能够说，在awk中，当想要匹配字符"^"或"$"时，无论它处于正則表達式的什么位置都应该用反斜杠对其进行转义。

參考资料：http://www.linuxawk.com/communication/441.html

Linux正則表達式-定位元字符

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > Linux正則表達式-定位元字符

Linux正則表達式-定位元字符

看完仍有疑问？有类似问题直接问程序猿