首页 > 代码库 > 经验总结22--抓取HTML数据,HtmlAgilityPack(续)

经验总结22--抓取HTML数据,HtmlAgilityPack(续)

如果获取的数据是HTML的话,我们就需要第三方工具有辅助获取我们需要的数据。

我选用了HtmlAgilityPack这么个工具。

首先肯定去网上下载一个,然后引用到项目中。下载地址:http://htmlagilitypack.codeplex.com/

HtmlAgilityPack提供很多方法。以下简单介绍下。

//查找标签://td
                //查找class://div[@class=\"id_email\"]
                //查找id://div[@id=\"id_email\"]

inode.NextSibling相邻节点

一般有class和id,应该基本够用了。

注:在使用工具前,保证获取的数据是HTML字符串。