首页 > 代码库 > 快速抓取某个网站内容方法
快速抓取某个网站内容方法
是不是有人相抓取网页上面的内容,放到别的网站上面。下面我给大家介绍一种最常用的方法:
用HtmlAgilityPack 组件。
public String GetHtml() { string url = "http://t.news.fx168.com/"; HttpWebRequest request = HttpWebRequest.Create(url) as HttpWebRequest; using (HttpWebResponse response = request.GetResponse() as HttpWebResponse) { using (Stream stream = response.GetResponseStream()) { HtmlDocument doc = new HtmlDocument(); doc.Load(stream, System.Text.Encoding.UTF8); HtmlNode node = doc.DocumentNode.SelectSingleNode("//div[@class=‘hzh_FX168_news_main_left_listbg3‘]"); return node.InnerHtml; } } }
大家可以运行下试试,抓取了火线速递的内容页面新闻列表。抓取规则是抓取DIV的CLASS为hzh_FX168_news_main_left_listbg3内的内容。
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。