首页 > 代码库 > 使用Chrome Headless 快速实现java版数据的抓取
使用Chrome Headless 快速实现java版数据的抓取
参考《使用Chrome快速实现数据的抓取(一)——概述》和《使用Chrome快速实现数据的抓取(二)——协议》。
各协议客户端实现参考:https://github.com/ChromeDevTools/awesome-chrome-devtools#chrome-devtools-protocol。
Java: cdp4j - Java library for CDP,使用这个类库实现。
地址:https://github.com/webfolderio/cdp4j
maven引入:
<dependency> <groupId>io.webfolder</groupId> <artifactId>cdp4j</artifactId> <version>1.1.0</version> </dependency>
官方例子: import io.webfolder.cdp.Launcher;import io.webfolder.cdp.session.Session;import io.webfolder.cdp.session.SessionFactory;public class HelloWorld { public static void main(String[] args) { Launcher launcher = new Launcher(); try (SessionFactory factory = launcher.launch(); Session session = factory.create()) { session.navigate("https://webfolder.io"); session.waitDocumentReady(); String content = (String) session.getProperty("//body", "outerText"); System.out.println(content); } } } 更多例子,如PrintToPDF,请参考https://github.com/webfolderio/cdp4j
使用Chrome Headless 快速实现java版数据的抓取
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。