首页 > 代码库 > hpple——网页http解析框架
hpple——网页http解析框架
TFHpple是一个小型的封装,可以用来解析html,它是对libxml的封装,语法是xpath。
使用Objective-C解析HTML或者XML,系统自带有两种方式一个是通过libxml,一个是通过NSXMLParser。
libxml性能较好,且可以结合urlconnection实现边下载边解析,在要求快速 、分批响应UI到情况下较为有用,NSXMLParser基本没什么优势,不如使用第三方工具。
Hpple,它是一个轻量级的包装框架,可以很好的解决这个问题,尤其是它支持HTML的解析,是其他XML类库所不及的地方,它是用XPath来定位和解析HTML或者XML。
使用步骤:
1、 -加入 libxml2 到你的项目中
到Project设置中,选all,找到Search paths下面的
Header Search Paths项目
添加新的 search path “${SDKROOT}/usr/include/libxml2″
注意选择 Enable recursive option
2、 -加入 libxml2 library 到你的项目
到Target中,选择Build Phases页
在Link Binary With Libraries中
从列表中选择libxml2.dylib
3、 -到这里下载ZIP包,将下面hpple的源代码加入到你的项目中:
HTFpple.h
HTFpple.m
HTFppleElement.h
HTFppleElement.m
XPathQuery.h
XPathQuery.m
4、 -简单应用举例
- #import "TFHpple.h"
- NSData *data = [[NSData alloc] initWithContentsOfFile:@"www.baidu.com"];
- // Create parser
- xpathParser = [[TFHpple alloc] initWithHTMLData:data];
- //Get all the cells of the 2nd row of the 3rd table
- NSArray *elements = [xpathParser search:@"//title"];
- // Access the first cell
- TFHppleElement *element = [elements objectAtIndex:0];
- // Get the text within the cell tag
- NSString *content = [element content];
- NSLog(@"%@",content);
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。