【python】正则表达式中的转义问题

2024-10-01 13:10:01 216人阅读

encode(‘string-escape‘) 解决

比如想匹配‘\x0e\x0a‘中的‘\x‘后的内容，这里希望把‘\x0e‘作为一个字符串，那么其中的\应该被转义。

未加转义的正则：

p = ‘(?<=\x)[0-9A-Za-z]{2}‘

直接这样写会报错，需要给\转义，于是变为

p = ‘(?<=\\x)[0-9A-Za-z]{2}‘

但由于使用的时候，会先将p的内容转义，然后匹配，所以又变成了\x和原始数据匹配，又会出错。解决：

p = ‘(?<=\\x)[0-9A-Za-z]{2}‘.encode(‘string-escape‘)

或者

p = ‘(?<=\\\\x)[0-9A-Za-z]{2}‘

测试代码：

import re

a = "\\x0e\\x0b\\x0c"
print a
p = ‘(?<=\\x)[0-9A-Za-z]{2}‘.encode(‘string-escape‘)
pattern = re.compile(p)
m = pattern.findall(a)
print m

输出：

\x0e\x0b\x0c
[‘0e‘, ‘0b‘, ‘0c‘]

【python】正则表达式中的转义问题

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们