首页 > 代码库 > python图片小爬虫

python图片小爬虫

import re
import urllib
import os

def rename(name): 
    name = name + '.jpg'
    return name  

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

def getImg(html):
    reg = r'src=http://www.mamicode.com/"(.+?\.jpg)" pic_ext'>



爬取的网页是  http://tieba.baidu.com/p/3553148164

图片保存在E盘pic文件夹下


爬取结果如下:

技术分享

python图片小爬虫