Python爬虫抓取煎蛋(jandan.net)无聊图

首页 > 代码库 > Python爬虫抓取煎蛋(jandan.net)无聊图

Python爬虫抓取煎蛋(jandan.net)无聊图

2024-10-04 07:15:02 214人阅读

 1 #!/usr/bin/python
 2 #encoding:utf-8
 3 ‘‘‘
 4 @python 3.6.1
 5 @author: 1109159477@qq.com
 6 @create date: 20170611
 7 
 8 ‘‘‘
 9 import requests
10 import urllib
11 import re
12 import os
13 
14 #当前最大页数
15 url=‘http://jandan.net/pic‘
16 data=http://www.mamicode.com/urllib.request.urlopen(url).read().decode(‘utf-8‘)
17 max_page_num=re.findall(r‘<span class.*current-comment-page.*?>\[(.*?)\]</span>‘,data)[1]
18 
19 def download_pic(start_page,stop_page,download_file):
20     for num in range(start_page,stop_page):
21         os.chdir(download_file)#图片保存目录
22         url=‘http://jandan.net/pic/page-%s‘ % num
23         data=http://www.mamicode.com/urllib.request.urlopen(url).read().decode(‘utf-8‘)
24         pics=re.findall(r‘<a href="http://(.*?)" target.*?</a><br />‘,data, re.I|re.S|re.M)
25         for i in pics:
26             i=‘http://‘+i
27             r=requests.get(i)
28             pic_name=i[28:100]
29             with open(pic_name,‘wb‘) as f:
30                 f.write(r.content)
31                 f.close()
32 
33 if __name__==‘__main__‘:
34     print(‘当前最大页数为:  %s‘ % max_page_num)
35     page1,page2=input(‘请输入要下载页数范围，例如     500,513 :‘).split(‘,‘)  
36     download_pic(int(page1),int(page2),r‘C:\Users\samsung\Desktop\jd_pics‘)
37

Python爬虫抓取煎蛋(jandan.net)无聊图

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > Python爬虫抓取煎蛋(jandan.net)无聊图

Python爬虫抓取煎蛋(jandan.net)无聊图

看完仍有疑问？有类似问题直接问程序猿