python练习册每天一个小程序第0009题

首页 > 代码库 > python练习册每天一个小程序第0009题

python练习册每天一个小程序第0009题

2024-10-27 03:03:02 210人阅读

 1 ‘‘‘
 2 题目描述：
 3   找出一个html文件中所有的url
 4   
 5 思路 ：
 6   利用正则表达式进行匹配
 7 
 8 ‘‘‘
 9 
10 
11 import re
12 
13 
14 with open(‘test.txt‘) as fp:
15     text = fp.read()
16     pattern = re.compile(
17         "((http|ftp|https)://)(([a-zA-Z0-9\._-]+\.[a-zA-Z]{2,6})|([0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}))(:[0-9]{1,4})*(/[a-zA-Z0-9\&%_\./-~-]*)?", re.DOTALL)
18     urls = pattern.findall(text)
19     for i in urls:
20         full_url = ‘‘
21         for url in i:
22             full_url += url
23 
24         print full_url

python练习册每天一个小程序第0009题

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > python练习册 每天一个小程序 第0009题

python练习册 每天一个小程序 第0009题

看完仍有疑问？有类似问题直接问程序猿

首页 > 代码库 > python练习册每天一个小程序第0009题

python练习册每天一个小程序第0009题