首页 > 代码库 > php爬虫 phpspider
php爬虫 phpspider
<?php /** * Created by PhpStorm. * User: brady * Date: 2016/12/9 * Time: 17:32 */ ini_set("memory_limit", "1024M"); require dirname(__FILE__).‘/../core/init.php‘; $url = "http://www.epooll.com/archives/806/"; $html = requests::get($url); // 抽取文章标题 $selector = "//*[@id=\"content\"]/div[1]/div[1]/h1/a"; $title = selector::select($html, $selector); // 检查是否抽取到标题 // 抽取文章作者 $selector = "//*[@id=\"content\"]/div[1]/div[1]/h6/span[1]"; $author = selector::select($html, $selector); // 检查是否抽取到作者 // 去掉 作者: $author = str_replace("作者:", "", $author); //发布时间 $selector = "//*[@id=\"content\"]/div[1]/div[1]/h6/span[2]"; $time = selector::select($html, $selector); $time = str_replace("发布时间:",‘‘, $time); $time = date("Y-m-d H:i:s",strtotime($time)); // 抽取文章内容 $selector = "//*[@id=\"content\"]/div[1]/div[2]"; $content = selector::select($html, $selector); // 检查是否抽取到内容 $data = http://www.mamicode.com/array("content", $data); var_dump($res);
php爬虫 phpspider
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。