首页 > 代码库 > 使用Socket抓取网页源代码
使用Socket抓取网页源代码
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.net.InetAddress; import java.net.Socket; public class HttpDemo { /** * 使用Socket抓取网页源码 */ public static void main(String[] args) throws IOException { //想要抓取的网页主机名 //域名www.baidu.com,旗下有好多主机,例如tieba.baidu.com,map.baidu.com String host = "map.baidu.com"; //根据主机名获取ip地址 InetAddress ip = InetAddress.getByName(host); //建立连接 Socket s = new Socket(ip,80); //向服务器端写入http协议请求 PrintWriter pw = new PrintWriter(s.getOutputStream()); // "/"请求根页面 pw.println("GET / HTTP/1.1"); pw.println("Host: "+host); pw.println("Content-Type: text/html"); pw.println(); pw.flush(); //将获取到的页面输出在控制台 BufferedReader br = new BufferedReader(new InputStreamReader(s.getInputStream())); String str = ""; while((str=br.readLine())!=null){ System.out.println(str); } br.close(); pw.close(); s.close(); } }
使用Socket抓取网页源代码
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。