首页 > 代码库 > scrapy新版本特性

scrapy新版本特性

1:在spider中返回一个自定义的字典,老版本中需要先定义一个Item,填充后再返回一个对象

 

技术分享

    新版本中可以直接返回一个字典

2:Per-spider settings  为每个spider进行单独设置,以前只能在settings文件中设置,在settings中的设置是全局的会作用到每个spider,当有多个spider的时候就不好处理

  在spider中定义个custom_settings的对象

技术分享

3:移除了Twisted的logging模块,使用python内置的logging模块

技术分享

4:重构Crawler API Crawler API refactoring

技术分享

scrapy新版本特性