首页 > 代码库 > python练习册 每天一个小程序 第0009题
python练习册 每天一个小程序 第0009题
1 ‘‘‘ 2 题目描述: 3 找出一个html文件中所有的url 4 5 思路 : 6 利用正则表达式进行匹配 7 8 ‘‘‘ 9 10 11 import re 12 13 14 with open(‘test.txt‘) as fp: 15 text = fp.read() 16 pattern = re.compile( 17 "((http|ftp|https)://)(([a-zA-Z0-9\._-]+\.[a-zA-Z]{2,6})|([0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}))(:[0-9]{1,4})*(/[a-zA-Z0-9\&%_\./-~-]*)?", re.DOTALL) 18 urls = pattern.findall(text) 19 for i in urls: 20 full_url = ‘‘ 21 for url in i: 22 full_url += url 23 24 print full_url
python练习册 每天一个小程序 第0009题
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。