python练习册每天一个小程序第0013题

首页 > 代码库 > python练习册每天一个小程序第0013题

python练习册每天一个小程序第0013题

2024-10-30 15:07:39 209人阅读

# -*-coding:utf-8-*—
‘‘‘
    题目描述：
         用 Python 写一个爬图片的程序，爬 这个链接里的日本妹子图片 :-)
    地址：
        http://tieba.baidu.com/p/2166231880

    思路：
        用正则表达式匹配图片链接，然后进行下载

‘‘‘
‘‘‘
import re
import requests

def main():
    url = ‘http://tieba.baidu.com/p/2166231880‘
    response = requests.get(url)
    html = response.text
    match = re.compile(‘img .*?src=http://www.mamicode.com/"(.*?)\"‘)
    for i in  match.findall(html):
        if ‘imgsrc‘ in i :
            print i

if __name__ == ‘__main__‘:
    main()
‘‘‘
 
import urllib2
import re
from os.path import basename
from urlparse import urlsplit

url = "http://tieba.baidu.com/p/2166231880"
def getPage(url):
    url=url+"?see_lz=1"
    urlContent = urllib2.urlopen(url).read()
    page=‘<span class="red">(.*?)</span>‘
    thePage=re.findall(page,urlContent)
    return int(thePage[0])
def downImg(url):
    urlContent = urllib2.urlopen(url).read()    
    spans=‘<cc>(.*?)</cc>‘
    ss=re.findall(spans,urlContent)
    obImgs=‘,‘.join(ss)
    imgUrls = re.findall(‘img .*?src="http://www.mamicode.com/(.*?)"‘, obImgs)
    for imgUrl in imgUrls:
        print imgUrl
        ‘‘‘
        try:
            imgData = http://www.mamicode.com/urllib2.urlopen(imgUrl).read()"Er.."
        ‘‘‘
def downLoad(url):
    numb=getPage(url)
    cont=0
    print "There are "+str(numb)+" pages."
    while cont<numb:
        cont+=1
        print "Downloading "+url+"?see_lz=1&pn="+str(cont)+"..."
        downImg(url+"?see_lz=1&pn="+str(cont))
    print ‘Completed!‘

downImg(url)

python练习册每天一个小程序第0013题

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > python练习册 每天一个小程序 第0013题

python练习册 每天一个小程序 第0013题

看完仍有疑问？有类似问题直接问程序猿

首页 > 代码库 > python练习册每天一个小程序第0013题

python练习册每天一个小程序第0013题