首页 > 代码库 > 正则表达式

正则表达式

正则表达式是查找和替换文本模式的简洁和灵活的表示法。Visual Studio 中使用的正则表达式是 Visual C++ 6.0 中使用的、具有简化语法的表达式的超集。

在“查找”、“在文件中查找”或“在文件中替换”对话框中,可使用下列正则表达式来改进和扩展搜索。

注意   在将下列任何表达式用作搜索条件的一部分之前,必须在“查找”、“在文件中查找”和“在文件中替换”对话框中选择“使用”复选框。

可使用下列表达式匹配搜索字符串中的字符或数字:

表达式语法说明
任一字符.匹配除换行符外的任何一个字符。
最多 0 项或更多*匹配前面表达式的 0 个或更多搜索项。
最多一项或更多+匹配前面表达式的至少一个搜索项。
最少 0 项或更多@匹配前面表达式的 0 个或更多搜索项,匹配尽可能少的字符。
最少一项或更多#匹配前面表达式的一个或更多搜索项,匹配尽可能少的字符。
重复 n 次^n匹配前面表达式的 n 个搜索项。例如,[0-9]^4 匹配任意 4 位数字的序列。
字符集[]匹配 [] 内的任何一个字符。要指定字符的范围,请列出由短划线 (-) 分隔的起始字符和结束字符,如 [a-z] 中所示。
不在字符集中的字符[^...]匹配跟在 ^ 之后的不在字符集中的任何字符。
行首^将匹配定位到行首。
行尾$将匹配定位到行尾。
词首<仅当词在文本中的此位置开始时才匹配。
词尾>仅当词在文本中的此位置结束时才匹配。
分组()将子表达式分组。
|匹配 OR 符号 (|) 之前或之后的表达式。). 最常用在分组中。例如,(sponge|mud) bath 匹配“sponge bath”和“mud bath”。
转义符\匹配跟在反斜杠 (\) 后的字符。这使您可以查找在正则表达式表示法中使用的字符,如 { 和 ^。例如,\^ 搜索 ^ 字符。
带标记的表达式{}标记括号内的表达式所匹配的文本。
第 n 个带标记的文本\n在“查找”或“替换”表达式中,指示第 n 个带标记的表达式所匹配的文本,其中 n 是从 1 至 9 的数字。

在“替换”表达式中,\0 插入整个匹配的文本。

右对齐字段\(w,n)在“替换”表达式中,将字段中第 n 个带标记的表达式右对齐至少 w 字符宽。
左对齐字段\(-w,n)在“替换”表达式中,将字段中第 n 个带标记的表达式左对齐至少 w 字符宽。
禁止匹配~(X)当 X 出现在表达式中的此位置时禁止匹配。例如,real~(ity)    匹配“realty”和“really”中的“real”,而不匹配“reality”中的“real”。
字母数字字符:a匹配表达式 
([a-zA-Z0-9])。
字母字符:c匹配表达式
([a-zA-Z])。
十进制数:d匹配表达式 
([0-9])。
十六进制数:h匹配表达式 
([0-9a-fA-F]+)。
标识符:i匹配表达式 
([a-zA-Z_$][a-zA-Z0-9_$]*)。
有理数:n匹配表达式 
(([0-9]+.[0-9]*)| ([0-9]*.[0-9]+)| ([0-9]+)).
带引号的字符串:q匹配表达式 (("[^"]*")| (‘[^‘]*‘))
字母字符串:w匹配表达式 
([a-zA-Z]+)
十进制整数:z匹配表达式 
([0-9]+)。
转义符\eUnicode U+001B。
Bell\gUnicode U+0007。
退格符\hUnicode U+0008。
换行符\n匹配与平台无关的换行符。在“替换”表达式中,插入换行符。
制表符\t匹配制表符,Unicode U+0009。
Unicode 字符\x#### 或 \u####匹配 Unicode 值给定的字符,其中 #### 是十六进制数。可以用 ISO 10646 代码点或两个提供代理项对的值的 Unicode 代码点指定基本多语种平面(即一个代理项)外的字符。

下表列出按标准 Unicode 字符属性进行匹配的语法。两个字母的缩写词与 Unicode 字符属性数据库中所列的一样。可将这些指定为字符集的一部分。例如,表达式 [:Nd:Nl:No] 匹配任何种类的数字。

表达式语法说明
大写字母:Lu匹配任何一个大写字母。例如,:Luhe 匹配“The”但不匹配“the”。
小写字母:Ll匹配任何一个小写字母。例如,:Llhe 匹配“the”但不匹配“The”。
词首大写字母:Lt匹配将大写字母和小写字母结合的字符,例如,Nj 和 Dz。
修饰符字母:Lm匹配字母或标点符号,例如逗号、交叉重音符和双撇号,用于表示对前一字母的修饰。
其他字母:Lo匹配其他字母,如哥特体字母 ahsa。
十进制数:Nd匹配十进制数(如 0-9)和它们的双字节等效数。
字母数字:Nl匹配字母数字,例如罗马数字和表意数字零。
其他数字:No匹配其他数字,如旧斜体数字一。
开始标点符号:Ps匹配开始标点符号,例如左方括号和左大括号。
结束标点符号:Pe匹配结束标点符号,例如右方括号和右大括号。
左引号:Pi匹配左双引号。
右引号:Pf匹配单引号和右双引号。
破折号:Pd匹配破折号标记。
连接符号:Pc匹配下划线标记。
其他标点符号:Po匹配逗号 (,)、?、"、!、@、#、%、&、*、\、冒号 (:)、分号 (;)、‘ 和 /。
空白分隔符:Zs匹配空白。
行分隔符:Zl匹配 Unicode 字符 U+2028。
段落分隔符:Zp匹配 Unicode 字符 U+2029。
无间隔标记:Mn匹配无间隔标记。
组合标记:Mc匹配组合标记。
封闭标记:Me匹配封闭标记。
数学符号:Sm匹配 +、=、~、| 、< 和 >。
货币符号:Sc匹配 $ 和其他货币符号。
修饰符号:Sk匹配修饰符号,如抑扬音、抑音符号和长音符号。
其他符号:So匹配其他符号,如版权符号、段落标记和度数符号。
其他控制:Cc匹配行尾。
其他格式:Cf格式化控制字符,例如双向控制字符。
代理项:Cs匹配代理项对的一半。
其他私用:Co匹配私用区域的任何字符。
其他未分配的字符:Cn匹配未映射到 Unicode 字符的字符。

除标准 Unicode 字符属性外,还可以指定下列附加属性。可将这些属性指定为字符集的一部分。

表达式语法说明
Alpha:Al匹配任何一个字符。例如,:Alhe 匹配“The”、“then”、“reached”等单词。
数字:Nu匹配任何一个数或数字。
标点符号:Pu匹配任何一个标点符号,如 ?、@、‘ 等等。
空白:Wh匹配所有类型的空格,包括印刷和表意文字的空格。
Bidi:Bi匹配诸如阿拉伯文和希伯来文这类从右向左书写的字符。
朝鲜文:Ha匹配朝鲜文和组合朝鲜文字母。
平假名:Hi匹配平假名字符。
片假名:Ka匹配片假名字符。
表意文字/汉字/日文汉字:Id匹配表意文字字符,如汉字和日文汉字

正则表达式