首页 > 代码库 > Perl语言学习笔记 9 正则表达式处理文本

Perl语言学习笔记 9 正则表达式处理文本

1、替换

s/PATTERN/REPLACE/;#返回是否替换成功的布尔值

可以使用捕获变量,如:s/(\w)/$1/

匹配失败则不做任何处理

2、定界符

对于没有左右之分的定界符,重复三次即可,如:s///、s###

对于有左右之分的定界符,需使用两对,一对包含模式,一对包含替换字符串,这两对可以不一样,如:s{}{}、s[]{}、s<>[]

3、可选修饰符

/g可进行全局替换,替换所有匹配到的字符串,如:s/ / /g

/s:使得 . 匹配所有字符

/i:大小写无关

4、绑定操作符

$file_name =~ s#^.*##s;#去除所哟Unix风格的路径

5、转义操作符

\U:全部转大写,或者到 \E 结束

\L:全部转小写,或者到 \E 结束

\u:其后的一个字符转大写

\l:其后的资格字符转小写

可以并用,\u\L 全部转小写,首字母大写

以上操作符可以在双引号内使用

6、拆分字符串:split

@fileds = split /:/,"abs:sdf:fdd";#返回结果列表

两个分割符连在一起,拆分出空字段,结尾处的会省略。

/\s+/可以进行空白分割,如:split /\s+/,$some_input;#所有的空白都当作一个空格处理,省略开头的空字段

7、串接字符串:join

my $x = join ":",4,6,8,10;#结果为$x = "4:6:8:10";

与split结合,先拆分,再用不同的定界符连接。

8、列表上下文中的m//

在列表上下文中使用m//时,如果匹配成功,返回所有捕获变量的列表,匹配失败返回空列表:my($first,$second,$third) = /(\s+) (\s+) (\s+)/;

/g 修饰符可以将m//匹配到许多地方,如:

9、非贪婪量词

默认情况下,/Fred.+barney/会先匹配“Fred”,然后将剩下的全部字符串匹配为“.+”,然后“.+”依次吐出一个字符,直到“barney”被匹配,此为贪婪模式。

在+、*、{}、?之后加上“?”,会使其变为非贪婪模式,从少到多匹配;

/m:跨行的模式匹配,加上之后会匹配行内的换行符;

10、一次更新多个文件

$^I:表示备份文件的后缀名,处理之前会先做备份,从备份文件中读取,然后再创建与源文件同名的文件,写入新的信息;

11、用命令行进行在线编辑

-p:自动生成小程序,while循环

-i.bak:备份文件名

-w:打开警告

-e:告诉程序后边是代码

fred*.dat:要处理的文件