首页 > 代码库 > Nodejs小爬虫
Nodejs小爬虫
记得先装载http这个模块
打开cmd :npm install http -g
var http=require(‘http‘) var url=‘http://www.imooc.com/learn/348‘ http.get(url,function(res){ var html=‘‘ res.on(‘data‘,function(data){ html +=data }) res.on(‘end‘,function(){ console.log(html) }) }).on(‘error‘,function(){ console.log(‘获取出错‘) })
cmd:node一下,出来网页源码
然后npm install cheerio -g
用慕课网做测试哈哈哈 ,这里要说明一点:代码和课程中是不一样的,因为网站改动了源代码,class之类的名字换掉了,所以之前的爬虫爬不出来的。还好知道原理以后自己去改就可以了。
/** * Created by Amy on 2017/7/13. */ var http= require(‘http‘) var cheerio= require(‘cheerio‘)//先装载这个模块 var url=‘http://www.imooc.com/learn/348‘ function filterChapters(html){ var $=cheerio.load(html) var chapters= $(‘.chapter‘) // [{ // chapterTitle:‘‘, // videos:[ // title:‘‘, // id:‘‘ // ] // }] var courseData=http://www.mamicode.com/[]>
去node一下试试,好神奇吧。
Nodejs小爬虫
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。