首页 > 代码库 > 用流从一个指定的网址抓取html代码
用流从一个指定的网址抓取html代码
package cn.bdqn.collect.test;import java.io.BufferedReader;import java.io.InputStream;import java.io.InputStreamReader;import java.net.URL;import java.net.URLConnection;public class TestGetHTML { public static void main(String[] args)throws Exception{ String target="http://www.boohee.com/food/group/1?page=1";//首先获取第一个分类下的列表----路径 //先把网址放在一个字符串中,再通过一个java的URL类转换成java程序可识别的网址 URL url=new URL(target);//java.net下的url类是专门用来表示一个网址的,如果提交的网址不对会抛出一个异常 //打开和这个网址的连接 URLConnection conn=url.openConnection(); //获得输入流,字节流 InputStream is=conn.getInputStream(); //字节流转换成字符流 InputStreamReader isr=new InputStreamReader(is, "utf-8");//第一个参数是字节流,第二个参数是要转换成什么编码格式,可以去网页源代码查看 //把转换流包装成缓冲流,缓冲流以行为单位一行一行的读17:45 BufferedReader br=new BufferedReader(isr); StringBuilder sb=new StringBuilder(); //用来以行为单位读取页面内容 String str=null; while ((str=br.readLine())!=null) { sb.append(str); sb.append("\r\n"); } //关闭缓冲流 br.close(); System.out.println(sb.toString()); }}
用流从一个指定的网址抓取html代码
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。