Python爬虫学习——使用selenium和phantomjs爬取js动态加载的网页

首页 > 代码库 > Python爬虫学习——使用selenium和phantomjs爬取js动态加载的网页

Python爬虫学习——使用selenium和phantomjs爬取js动态加载的网页

2024-09-18 16:56:26 218人阅读

1.安装selenium

pip install selenium
Collecting selenium
  Downloading selenium-3.4.1-py2.py3-none-any.whl (931kB)
    100% |████████████████████████████████| 942kB 573kB/s 
Installing collected packages: selenium
Successfully installed selenium-3.4.1

2.安装phantomjs

下载地址：http://phantomjs.org/download.html

下载的版本是：phantomjs-2.1.1-linux-x86_64.tar.bz2

解压下载好的文件，并把文件夹移动到/usr/local目录下

sudo mv phantomjs-2.1.1-linux-x86_64 /usr/local/phantomjs

在/etc/profile下添加，之后source /etc/profile

export PHANTOMJS_HOME=/usr/local/phantomjs
export PATH=$PATH:$PHANTOMJS_HOME/bin

测试是否安装成功

phantomjs -v
2.1.1

Python爬虫学习——使用selenium和phantomjs爬取js动态加载的网页

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > Python爬虫学习——使用selenium和phantomjs爬取js动态加载的网页

Python爬虫学习——使用selenium和phantomjs爬取js动态加载的网页

看完仍有疑问？有类似问题直接问程序猿