python 爬取淘宝的模特照片

首页 > 代码库 > python 爬取淘宝的模特照片

python 爬取淘宝的模特照片

2024-09-12 07:38:00 216人阅读

前段时间花了一部分时间学习下正则表达式，总觉得利用正则要做点什么事情，所以想通过爬取页面的方式把一些美女的照片保存下来，其实过程很简单。

1.首先读取页面信息；

2.过滤出来照片的url地址；

3.通过URL地址来保存图片；

#-*-coding:utf-8 -*-
‘‘‘爬取评论区的美女照片‘‘‘
import requests
import re
RE_PICTURE_NAME = re.compile(r‘(\w)+\.[A-Za-z]+$‘)
RE_URL = re.compile(r‘(\w)+\.(\w)+\.(\w)+/(\w)+\/(\w){2,}\/(\w)+.jpg‘)
request_top_list = requests.get(‘https://mm.taobao.com/json/request_top_list.htm‘)
RESPONSE = request_top_list.text #resp.text返回的是Unicode型的数据
def Get_Reuest_Picture_List(RESPONSE):
    ‘‘‘抓取页面的所有URL‘‘‘
    URLS = []
    for match in RE_URL.finditer(RESPONSE): #所有与pattern相匹配的全部字串，以迭代器的形式返回 与findall的区别,findall在字符串中找到正则表达式所匹配的所有子串，并组成一个列表返回
        URL = match.group()
        URLS.append(‘http://‘+URL)
    return URLS

def Download_Url_Picture(URL):
    ‘‘‘下载图片‘‘‘
    REQUEST_CONTENT = requests.get(URL).content #resp.content返回的是bytes型也就是二进制的数据
    PICTURE_NAME = RE_PICTURE_NAME.search(URL).group(0) #根据url获取图片名字
    FILE_OBJECT = open(str(PICTURE_NAME),‘wb‘) #以二进制的方式写文件
    FILE_OBJECT.write(‘picture\\‘+REQUEST_CONTENT)
    FILE_OBJECT.close()


def Save_All_Picture(URLS):
    ‘‘‘保存所有请求中的图片‘‘‘
    for URL in URLS:
        Download_Url_Picture(URL)

if __name__ == ‘__main__‘:
    URLS = Get_Reuest_Picture_List(RESPONSE)
    Save_All_Picture(URLS)

python 爬取淘宝的模特照片

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > python 爬取淘宝的模特照片

python 爬取淘宝的模特照片

看完仍有疑问？有类似问题直接问程序猿