首页 > 代码库 > python正则表达式

python正则表达式

python正则表达式中的特殊字符:

^          表示匹配的字符必须在最前边

$          表示匹配的字符必须在最后边

*          匹配* 前面的字符0次或n次

+          匹配+ 前面的字符1次或n次

        匹配?前面的字符0次或1次

.           (小数点)匹配除换行符外的所有字符

(x)        匹配x并记录匹配的值

x|y       匹配x或者y

{n}       这里n是一个正整数。匹配前面的n个字符

{n,}   这里n是一个正整数。匹配至少n个前面的字符

{n,m} 这里n和m都是正整数。匹配至少n个、最多m个前面的字符

[xyz]      字符列表,匹配表中的任一字符,可以通过连接字符 - 指出字符范围,如 [a-z] 表示所有小写字符

[b]        匹配一个空格

          匹配一个单词的分界线,比如一个空格

         匹配一个单词的非分界线


re模块匹配规则(re.match函数的第三个参数)

re.IGNORECASE       忽略文中的大小写

re.LOCALE                  处理字符集本地化

re.MULTILINE             是否支持多行匹配

re.DOTALL                  匹配一些特殊标记,例如使用.匹配\n等字符

re.VERBOSE              忽略正则表达式中的空格或者换行等字符

re.UNICODE              使用Unicode编码

 

以下是一个匹配邮箱的例子

def isEmail(email):    isMatch = bool(re.match(r"^([a-zA-Z]+)([0-9]*)@([a-z0-9A-Z]+\.)+[a-zA-Z]{2,}$", email, re.IGNORECASE))    if isMatch:        print "email is correct."    else:        print "email is wrong."    return isMatch

 

python正则表达式