首页 > 代码库 > 什么是正则表达式

什么是正则表达式

正则表达式(通常称作regex)提供了一种灵活的在文本中搜索或匹配字符串模式的方式。正则表达式是根据正则表达式语言编写的字符串。Python内置的re模块负责对字符串应用正则表达式。

一个regex描述了需要在文本中定位的一个模式。

例子:假设我要拆分一个字符串,分隔符可能是制表符、空格、换行符等。描述一个或多个空白符的regex是\s+:

技术分享

调用re.split(‘\s+‘, text)时,正则表达式会先被编译,然后再在text上调用其split方法。

你可以用re.compile自己编译regex以得到一个可重用的regex对象:

In []: regex = re.compile(‘\s+‘)

In []: regex.split(text)

Out[]: [‘foo‘, ‘bar‘, ‘baz‘, ‘qux‘]

什么是正则表达式