首页 > 代码库 > Python 实现类似PHP的strip_tags函数功能,并且可以自定义设置保留标签
Python 实现类似PHP的strip_tags函数功能,并且可以自定义设置保留标签
最近在研究 Python ,发现用的还是很不习惯,很多PHP里面很简单的功能在Python 里面都得找半天,而且很多功能都得自己实现。
今天做个采集,需要过滤内容中的标签,搞了一下午,貌似终于搞出来了,测试了下达到了预想的效果,废话不多说贴上代码吧
from html.parser import HTMLParser def strip_tags(html, save=None): result = [] start = [] data = http://www.mamicode.com/[]>
使用方法:result = strip_tags("""发生的杀毒<a target="_blank" title="足球比分直播" href=http://www.mamicode.com/"http://live.500.com/" >足球比分直播竞彩足球篮球竞彩
输出结果:
发生的杀毒足球比分直播竞彩足球篮球竞彩 <img src=http://www.mamicode.com/"dd" alt=">">打蛇打七寸,北单7串1。由于北京单场SP值计算规则与竞彩不同,4串1及以下投注购买竞彩更划算,而7串1以上的投注很可能交税,反而不划算。根据计算,北京单场4串1到7串1之间的投注最划算。
>
仅保留 <a> 和 <p> 标签
Python 实现类似PHP的strip_tags函数功能,并且可以自定义设置保留标签
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。