首页 > 代码库 > JS——正则表达式

JS——正则表达式

RegExp正则表达式

正则表达式是一种用来匹配字符串的强有力的武器。它的设计思想是用一种描述性的语言来给字符串定义一个规则,凡是符合规则的字符串,我们就认为它“匹配”了,否则,该字符串就是不合法的。

(1) \d可以匹配一个数字

(2) \w可以匹配一个字母或数字,

(3) .可以匹配任意字符

(4)\s可以匹配一个空格(也包括Tab等空白符)

(5)用*表示任意个字符(包括0个),用+表示至少一个字符,用?表示0个或1个字符,用{n}表示n个字符,用{n,m}表示n-m个字符

(6)特殊字符,在正则表达式中,要用‘\‘转义

(7)要做更精确地匹配,可以用[]表示范围

(8)A|B可以匹配A或B

(9)^表示行的开头,^\d表示必须以数字开头。$表示行的结束,\d$表示必须以数字结束。

作用:

1. RegExp对象的test()方法用于测试给定的字符串是否符合条件。

var re = /^\d{3}\-\d{3,8}$/;
re.test(‘010-12345‘); // true
re.test(‘010-1234x‘); // false
re.test(‘010 12345‘); // false

2.用正则表达式切分字符串比用固定的字符更灵活,请看正常的切分代码:

‘a,b;; c  d‘.split(/[\s\,\;]+/); // [‘a‘, ‘b‘, ‘c‘, ‘d‘]

3.正则表达式还有提取子串的强大功能,用()表示的就是要提取的分组(Group)。

^(\d{3})-(\d{3,8})$分别定义了两个组,可以直接从匹配的字符串中提取出区号和本地号码:

var re = /^(\d{3})-(\d{3,8})$/;
re.exec(‘010-12345‘); // [‘010-12345‘, ‘010‘, ‘12345‘]
re.exec(‘010 12345‘); // null

如果正则表达式中定义了组,就可以在RegExp对象上用exec()方法提取出子串来。

exec()方法在匹配成功后,会返回一个Array,第一个元素是正则表达式匹配到的整个字符串,后面的字符串表示匹配成功的子串。

exec()方法在匹配失败时返回null

4.需要特别指出的是,正则匹配默认是贪婪匹配,也就是匹配尽可能多的字符。举例如下,匹配出数字后面的0

var re = /^(\d+)(0*)$/;
re.exec(‘102300‘); // [‘102300‘, ‘102300‘, ‘‘]

  必须让\d+采用非贪婪匹配(也就是尽可能少匹配),才能把后面的0匹配出来,加个?就可以让\d+采用非贪婪匹配:

var re = /^(\d+?)(0*)$/;
re.exec(‘102300‘); // [‘102300‘, ‘1023‘, ‘00‘]

5.全局搜索

JavaScript的正则表达式还有几个特殊的标志,最常用的是g,表示全局匹配。

全局匹配类似搜索,因此不能使用/^...$/,那样只会最多匹配一次。

正则表达式还可以指定i标志,表示忽略大小写,m标志,表示执行多行匹配。

JS——正则表达式