首页 > 代码库 > 正则表达式(上)

正则表达式(上)

内容提纲:

1.什么是正则表达式

2.创建正则表达式

 转载请注明出处,谢谢!

假设用户需要在HTML表单中填写姓名、地址、出生日期等。那么在将表单提交到服务器进一步处理前,JavaScript程序会检查表单以确认用户确实输入了信息并且这些信息是符合要求的。这时候就需要用到正则表达式。

一.什么是正则表达式

正则表达式(regular expression)是一个描述字符模式的对象。ECMAScript的RegExp类表示正则表达式,而String和RegExp都定义了使用正则表达式进行强大的模式匹配和文本检索与替换的函数。

正则表达式主要用来验证客户端的输入数据。用户填写完表单,单击按钮之后,表单就会被发送到服务器,在服务器端通常会用PHP、ASP.NET等服务器脚本对其进行进一步处理。因为客户端验证,可以节约大量的服务器端的系统资源,并且提供更好的用户体验,所在提交到服务器处理之前可以在客户端使用正则表达式进行验证。

 

二.创建正则表达式

创建正则表达式和创建字符串类似,创建正则表达式提供了两种方法,一种是采用new运算符,另一个是采用字面量方式

1.采用new运算符方式

var box = new RegExp(‘box‘);                            //第一个参数字符串

var box = new RegExp(‘box‘, ‘ig‘);                      //第二个参数可选模式修饰符

 

模式修饰符的可选参数

参  数

含  义

i

忽略大小写

g

全局匹配

m

多行匹配

2.采用字面量方式

var box = /box/;                                               //直接用两个反斜杠

var box = /box/ig;                                            //在第二个斜杠后面加上模式修饰符

 

3.测试正则表达式

RegExp对象包含两个方法:test()和exec(),功能基本相似,用于测试字符串匹配。

test()方法在字符串中查找是否存在指定的正则表达式并返回布尔值,如果存在则返回true,不存在则返回false。

exec()方法也用于在字符串中查找指定正则表达式,如果exec()方法执行成功,则返回包含该查找字符串的相关信息数组。如果执行失败,则返回null。

 

RegExp对象的方法

方  法

功  能

test

在字符串中测试模式匹配,返回true或false

exec

在字符串中执行匹配搜索,返回结果数组

 

/*使用new运算符的test方法示例*/

var pattern = new RegExp(‘box‘, ‘i‘);                      //创建正则模式,不区分大小写 

var str = ‘This is a Box!‘;                                          //创建要比对的字符串

alert(pattern.test(str));                                            //通过test()方法验证是否匹配

 

/*使用字面量方式的test方法示例*/

var pattern = /box/i;                                                 //创建正则模式,不区分大小写

var str = ‘This is a Box!‘;

alert(pattern.test(str));

 

/*使用一条语句实现正则匹配*/(看起来比较乱,一般不建议使用!)

alert(/box/i.test(‘This is a Box!‘));                          //模式和字符串替换掉了两个变量

/*使用exec返回匹配数组*/

var pattern = /box/i;

var str = ‘This is a Box!‘;

alert(pattern.exec(str));                                       //匹配了返回数组,否则返回null

 

PS:exec方法还有其他具体应用,我们在获取控制学完后再看(见下篇)。

 

4.使用字符串的正则表达式方法

除了test()和exec()方法,String对象也提供了4个使用正则表达式的方法(使用方式与est()和exec()方法作对比)

 

String对象中的正则表达式方法

方  法

含  义

match(pattern)

返回pattern中的子串或null

replace(pattern, replacement)

用replacement替换pattern

search(pattern)

返回字符串中pattern开始位置

split(pattern)

返回字符串按指定pattern拆分的数组

 

/*使用match方法获取获取匹配数组*/

var pattern = /box/ig;                                                   //全局搜索

var str = ‘This is a Box!,That is a Box too‘;

alert(str.match(pattern));                                             //匹配到两个:Box,Box
alert(str.match(pattern).length);                            //获取数组的长度

 

/*使用search来查找匹配数据*/

var pattern = /box/ig;

var str = ‘This is a Box!,Thatis a Box too‘;

alert(str.search(pattern));                                          //查找到第一个然后返回起始位置,否则返回-1

 

PS:因为search方法查找到即返回,也就是说无需g全局。

 

/*使用replace替换匹配到的数据*/

var pattern = /box/ig;

var str = ‘This is a Box!,That is a Box too‘;

alert(str.replace(pattern, ‘Tom‘));                         //将Box替换成了Tom

 

/*使用split拆分成字符串数组*/

var pattern = / /ig;                                                //按照空格分隔

var str = ‘This is a Box!,That is a Box too‘;

alert(str.split(pattern));                                      //将空格拆开分组成数组

 

RegExp对象的静态属性(用处不大)

属  性

短  名

含  义

input

$_

当前被匹配的字符串

lastMatch

$&

最后一个匹配字符串

lastParen

$+

最后一对圆括号内的匹配子串

leftContext

$`

最后一次匹配前的子串

multiline

$*

用于指定是否所有的表达式都用于多行的布尔值

rightContext

$‘

在上次匹配之后的子串

 

/*使用静态属性*/

var pattern = /(g)oogle/;

var str = ‘This is google!‘;

pattern.test(str);                                                //首先要执行一下

alert(RegExp.input);                                         //Thisis google!

alert(RegExp.leftContext);                                //This is

alert(RegExp.rightContext);                              //!

alert(RegExp.lastMatch);                                   //google

alert(RegExp.lastParen);                                    //g(分组,圆括号,后面讲)

alert(RegExp.multiline);                                    //false

 

PS:Opera不支持input、lastMatch、lastParen和multiline属性。IE不支持multiline属性。

所有的属性可以使用短名来操作,RegExp.input可以改写成RegExp[‘$_‘],依次类推。但RegExp.input比较特殊,它还可以写成RegExp.$_。

 

RegExp对象的实例属性(用处不大)

属  性

含  义

global

Boolean值,表示g是否已设置

ignoreCase

Boolean值,表示i是否已设置

lastIndex

整数,代表下次匹配将从哪里字符位置开始

multiline

Boolean值,表示m是否已设置

Source

正则表达式的源字符串形式

 

/*使用实例属性*/

var pattern = /google/ig;

alert(pattern.global);                                          //true,是否全局了,g

alert(pattern.ignoreCase);                                  //true,是否忽略大小写,i

alert(pattern.multiline);                                     //false,是否支持换行,m

alert(pattern.lastIndex);                                     //0,下次的匹配位置

alert(pattern.source);                                         //google,正则表达式的源字符串

 

var pattern = /google/g;

var str = ‘google google google‘;

pattern.test(str);                                                 //google,匹配第一次

alert(pattern.lastIndex);                                     //6,第二次匹配的起始位置(要有g)

 

PS:以上基本没什么用。并且lastIndex在获取下次匹配位置上IE和其他浏览器有偏差,主要表现在非全局匹配上。lastIndex还支持手动设置,直接赋值操作。

 更多深入内容,见正则表达式(下)。

For my lover, CC!

Thank you, Mr Lee!

正则表达式(上)