首页 > 代码库 > Ubuntu16.04安装爬虫框架scrapy
Ubuntu16.04安装爬虫框架scrapy
scrapy框架需要在Python 2.7,lxml,OpenSSL,pip程序或库的基础之上创建。
因此 ,首先,先检查下是否包含上述四个程序或库
kuku@worker1:~$ python Python 2.7.12 (default, Jul 1 2016, 15:12:24) [GCC 5.4.0 20160609] on linux2 Type "help", "copyright", "credits" or "license" for more information. >>>
可以看到Ubuntu16.04已经预置了python 2.7
接着查看是否还有lxml
>>> import lxml Traceback (most recent call last): File "<stdin>", line 1, in <module> ImportError: No module named lxml >>> >>> import OpenSSL >>>
发现没有lxml,有OpenSSL,于是先安装lxml
kuku@worker1:~$ sudo apt-get install python-lxml
重新进入
kuku@worker1:~$ python Python 2.7.12 (default, Jul 1 2016, 15:12:24) [GCC 5.4.0 20160609] on linux2 Type "help", "copyright", "credits" or "license" for more information. >>> import lxml >>>
没有报错。为保证后续正确安装,需依次执行
kuku@worker1:~$ sudo apt-get install python-dev
kuku@worker1:~$ sudo apt-get install libevent-dev
kuku@worker1:~$ sudo apt-get install python-pip
kuku@worker1:~$ sudo pip install --upgrade pip
最后执行
kuku@worker1:~$ pip install Scrapy
即可完成Scrapy的安装,查看下scrapy相关命令
kuku@worker1:~$ scrapy
然后可以创建一个新的项目
kuku@worker1:~$ scrapy startproject newproject New Scrapy project ‘newproject‘, using template directory ‘/usr/local/lib/python2.7/dist-packages/scrapy/templates/project‘, created in: /home/kuku/newproject You can start your first spider with: cd newproject scrapy genspider example example.com kuku@worker1:~$ kuku@worker1:~$ sudo apt install tree
使用tree看下newproject文件目录
kuku@worker1:~$ tree newproject/
接下来可以根据自己需要对里面文件进行相应的编辑,以满足自己需求。
本文出自 “lefteva” 博客,请务必保留此出处http://lefteva.blog.51cto.com/11892835/1873661
Ubuntu16.04安装爬虫框架scrapy
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。