首页 > 代码库 > 爬虫工具开发进度

爬虫工具开发进度

最初是想端午节放假3天写一个爬虫,原型版本完成后。。发现自己想要的其实是数据采集工具。

目前进度如下

 

已完成:

1.简易WPF界面,Log显示,开关暂停

2.硬盘结果写入,xml配置文件读写。

3.html分析,用的indexof分析全文。但稳定抓了一星期百度贴吧,中途没崩过。

 

未完成:

1.xml文件图形化编辑,保存,预览。

2.网页搜索结果,可图形化预览。

 

 

最近抓取准备换成HtmlAgility或者Jumony。走这一步问题很多,于是排在后面。