首页 > 代码库 > 请对 POSIX 风格和兼容 Perl 风格两种正则表达式的主要函数进行类比说明
请对 POSIX 风格和兼容 Perl 风格两种正则表达式的主要函数进行类比说明
POSIXF风格的正则表达式主要函数有ereg 函数:(正则表达式匹配)、ereg_replace 函数:(正则表达式替换)
Perl风格的正则表达式主要函数有preg_match 函数:(进行正则表达式匹配)、preg_replace 函数:(执行正则表达式的搜索和替换)
1、匹配正则表达式对比
int ereg ( string $pattern , string $string [, array &$regs ] )
int preg_match ( string $pattern , string $subject [, array &$matches [, int $flags = 0 [, int $offset = 0 ]]] )
Note: 使用 Perl 兼容正则表达式语法的 preg_match() 函数通常是比 ereg() 更快的替代方案。
pattern:
要搜索的模式,字符串类型。
subject:
输入字符串。
matches:
如果提供了参数matches
,它将被填充为搜索结果。 $matches[0]将包含完整模式匹配到的文本,$matches[1] 将包含第一个捕获子组匹配到的文本,以此类推。
返回值
preg_match()返回 pattern
的匹配次数。 它的值将是0次(不匹配)或1次,因为preg_match()在第一次匹配后 将会停止搜索。preg_match_all()不同于此,它会一直搜索subject
直到到达结尾。 如果发生错误preg_match()返回FALSE
。
范例:
Example #1 查找文本字符串"php"
<?php //模式分隔符后的"i"标记这是一个大小写不敏感的搜索 if (preg_match("/php/i", "PHP is the web scripting language of choice.")) { echo "A match was found."; } else { echo "A match was not found."; } ?>
Example #2 查找单词"word"
<?php /* 模式中的\b标记一个单词边界,所以只有独立的单词"web"会被匹配,而不会匹配 * 单词的部分内容比如"webbing" 或 "cobweb" */ if (preg_match("/\bweb\b/i", "PHP is the web scripting language of choice.")) { echo "A match was found."; } else { echo "A match was not found."; } if (preg_match("/\bweb\b/i", "PHP is the website scripting language of choice.")) { echo "A match was found."; } else { echo "A match was not found."; } ?>
Example #3 获取URL中的域名
<?php //从URL中获取主机名称 preg_match(‘@^(?:http://)?([^/]+)@i‘, "http://www.php.net/index.html", $matches); $host = $matches[1]; //获取主机名称的后面两部分 preg_match(‘/[^.]+\.[^.]+$/‘, $host, $matches); echo "domain name is: {$matches[0]}\n"; ?>
输出结果
domain name is: php.net
Example #4 使用命名子组
<?php $str = ‘foobar: 2008‘; preg_match(‘/(?P<name>\w+): (?P<digit>\d+)/‘, $str, $matches); /* 下面例子在php 5.2.2(pcre 7.0)或更新版本下工作, 然而, 为了后向兼容, 上面的方式是推荐写法. */ // preg_match(‘/(?<name>\w+): (?<digit>\d+)/‘, $str, $matches); print_r($matches); ?>
输出结果
Array ( [0] => foobar: 2008 [name] => foobar [1] => foobar [digit] => 2008 [2] => 2008 )
Tip
如果你仅仅想要检查一个字符串是否包含另外一个字符串,不要使用preg_match()。 使用strpos()或strstr()替代完成工作会更快。
2、替换正则表达式对比
string ereg_replace ( string $pattern , string $replacement , string $string )
mixed preg_replace ( mixed $pattern , mixed $replacement , mixed $subject [, int $limit = -1 [, int &$count ]] )
Tip:preg_replace() 函数使用了 Perl 兼容正则表达式语法,通常是比 ereg_replace() 更快的替代方案。
搜索subject
中匹配pattern
的部分, 以replacement
进行替换。
pattern:
要搜索的模式。可以使一个字符串或字符串数组。
replacement:
用于替换的字符串或字符串数组。如果这个参数是一个字符串,并且pattern
是一个数组,那么所有的模式都使用这个字符串进行替换。如果pattern
和replacement
都是数组,每个pattern
使用replacement
中对应的 元素进行替换。如果replacement
中的元素比pattern
中的少, 多出来的pattern
使用空字符串进行替换。
subject:
要进行搜索和替换的字符串或字符串数组。
limit
每个模式在每个subject
上进行替换的最大次数。默认是 -1(无限)。
count
如果指定,将会被填充为完成的替换次数。
返回值
如果subject
是一个数组, preg_replace()返回一个数组, 其他情况下返回一个字符串。
如果匹配被查找到,替换后的subject
被返回,其他情况下 返回没有改变的 subject
。如果发生错误,返回 NULL
。
Example #1 使用后向引用紧跟数值原文
<?php $string = ‘April 15, 2003‘; $pattern = ‘/(\w+) (\d+), (\d+)/i‘; $replacement = ‘${1}1,$3‘; echo preg_replace($pattern, $replacement, $string); ?>
运行结果
April1,2003
Example #2 preg_replace()中使用基于索引的数组
<?php $string = ‘The quick brown fox jumped over the lazy dog.‘; $patterns = array(); $patterns[0] = ‘/quick/‘; $patterns[1] = ‘/brown/‘; $patterns[2] = ‘/fox/‘; $replacements = array(); $replacements[2] = ‘bear‘; $replacements[1] = ‘black‘; $replacements[0] = ‘slow‘; echo preg_replace($patterns, $replacements, $string); ?>
以上例程会输出:
The bear black slow jumped over the lazy dog.
对模式和替换内容按key进行排序我们可以得到期望的结果。
<?php ksort($patterns); ksort($replacements); echo preg_replace($patterns, $replacements, $string); ?>
以上例程会输出:
The slow black bear jumped over the lazy dog.
Example #3 替换一些值
<?php $patterns = array (‘/(19|20)(\d{2})-(\d{1,2})-(\d{1,2})/‘, ‘/^\s*{(\w+)}\s*=/‘); $replace = array (‘\3/\4/\1\2‘, ‘$\1 =‘); echo preg_replace($patterns, $replace, ‘{startDate} = 1999-5-27‘); ?>
以上例程会输出:
$startDate = 5/27/1999
Example #4 剥离空白字符
这个例子剥离多余的空白字符
<?php $str = ‘foo o‘; $str = preg_replace(‘/\s\s+/‘, ‘ ‘, $str); // 将会改变为‘foo o‘ echo $str; ?>
Example #5 使用参数count
<?php $count = 0; echo preg_replace(array(‘/\d/‘, ‘/\s/‘), ‘*‘, ‘xp 4 to‘, -1 , $count); echo $count; //3 ?>
以上例程会输出:
xp***to
3
注释
Note:
当使用数组形式的
pattern
和replacement
时, 将会按照key在数组中出现的顺序进行处理. 这不一定和数组的索引顺序一致. 如果你期望使用索引对等方式用replacement
对pattern
进行替换, 你可以在调用preg_replace()之前对两个数组各进行一次ksort()排序.
链接:
http://php.net/manual/zh/function.ereg.php
http://php.net/manual/zh/function.preg-match.php
http://php.net/manual/zh/function.ereg-replace.php
http://php.net/manual/zh/function.preg-replace.php
请对 POSIX 风格和兼容 Perl 风格两种正则表达式的主要函数进行类比说明