scrapy基础知识之处理Redis里的数据：

首页 > 代码库 > scrapy基础知识之处理Redis里的数据：

scrapy基础知识之处理Redis里的数据：

2024-10-03 09:38:39 216人阅读

数据爬回来了，但是放在Redis里没有处理。之前我们配置文件里面没有定制自己的ITEM_PIPELINES，而是使用了RedisPipeline，所以现在这些数据都被保存在redis的xx:items键中，所以我们需要另外做处理。

在目录下可以看到一个process_items.py文件，这个文件就是scrapy-redis的example提供的从redis读取item进行处理的模版。

假设我们要把xx:items中保存的数据读出来写进MongoDB或者MySQL，那么我们可以自己写一个process_xx_profile.py文件，然后保持后台运行就可以不停地将爬回来的数据入库了。

存入MongoDB

在目录下新建process_item_mongo.py文件

#coding=utf-8
import pymongo
import redis
import json

def process_item():
    Redis_conn=redis.StrictRedis(host=‘localhost‘,port=6379,db=0)
    Mongo_conn=pymongo.MongoClient(host=‘localhost‘,port=27017)
    db_name=Mongo_conn["dbname"]
    table_name=db_name["tablename"]
    while True:
        source, data = http://www.mamicode.com/Redis_conn.blpop(["xx:items"])
        data = http://www.mamicode.com/json.loads(data.decode("utf-8"))
        table_name.insert(data)
if __name__=="__main__":
    process_item()

存入 MySQL

在目录下新建process_item_mysql.py文件

#coding=utf-8
import pymysql
import redis
import json

def process_item():
    Redis_conn=redis.StrictRedis(host=‘127.0.0.1‘,port=6379,db=0)
    MySql_conn=pymysql.connect(host=‘127.0.0.1‘,user=‘‘,passwd=‘‘,port=3306,db=‘dbname‘)
    while True:
        source,data=http://www.mamicode.com/Redis_conn.blpop("xx:items")
        data=http://www.mamicode.com/json.loads(data.decode("utf-8"))
        cur=MySql_conn.cursor()
        sql=("insert into xx(字段)"
             "VALUES (%s)")
        lis = (data[‘xx‘])
        cur.execute(sql,lis)
        MySql_conn.commit()
        cur.close()
        MySql_conn.close()
    if __name__=="__main__":
        process_item()
需要新建数据库以及表，字段

scrapy基础知识之处理Redis里的数据：

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > scrapy基础知识之 处理Redis里的数据：