首页 > 代码库 > 【网络爬虫】 预备知识
【网络爬虫】 预备知识
【网络爬虫】 预备知识
一. 正则表达式之常用表达式
正则表达式里有很多东西,学精不易,但做爬虫不需要学精,只要会其中部分就行,下面将介绍本人常用的表达式,基本够用了。
1. 去头去尾 --- (?<=...)...(?=...)
该表达式是本人用的最多的,如题意,去头去尾匹配中间,匹配单条数据时非常好用,正则好写,容易理解,且匹配出来的东西就是想要的
2. 分组 ---(?<组名>...)...
该表达式主要用在用一个正则匹配多条数据时使用
会了上面2个基本就没问题了
二. 抓包工具,做爬虫这是至关重要的,没有工具基本是做不出来的
这里推荐 ie11 自带的 F12。
目前还没发现抓不到的包,而且自带搜索功能也很给力
【网络爬虫】 预备知识
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。