首页 > 代码库 > python-简单爬虫抓取贴吧图片
python-简单爬虫抓取贴吧图片
一个简单的爬虫练习
import urllib.request import re def getHtml(url): page = urllib.request.urlopen(url) #read()返回的结果是二进制的需要转换成字符串 html =page.read().decode("utf-8") return html def getImage(page): reg=r‘src="http://www.mamicode.com/(.+?\.jpg)" size‘ imgre=re.compile(reg) print (imgre) imglist=re.findall(imgre,page) print (imglist) x=0 for i in imglist: urllib.request.urlretrieve(i,‘%s.jpg‘ %x) x+=1 return imglist html=getHtml("http://tieba.baidu.com/p/4721099001") print(getImage(html))
python-简单爬虫抓取贴吧图片
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。