首页 > 代码库 > 爬虫模拟登陆之formdata表单数据

爬虫模拟登陆之formdata表单数据

首先HTTP协议是个无连接的协议,浏览器和服务器之间是以循环往复的请求回复来交互的,交互的形式是以文件形式来进行的。比如在chrome开发者工具network中看到了

技术分享

 

每一行是一个文件,又文件大小啊,文件类型啊,比如脚本,图片等。

根据协议,把每个文件的内容按照协议格式填入HTTP数据协议结构,其中,对于爬虫模拟登陆来说最重要的是表单数据formdata这个字段

技术分享

 

 在这我们看到又loginname字段,又password字段,我们看到这都是明码,所以做了遮挡。我们得到了这个,就可以根据字段名称自己组装数据了,

另外还需要注意的是,formdata所在的文件,前面我们说了,浏览器与服务器之间是以文件形式交互的,开发者工具也是以文件为单位来抓包的,所以我们需要找对文件

这个只能自己找了,比如知乎,包含账号密码的表单数据存在与“email"文件中,比如在智联招聘中,包含账号密码的表单数据存在与“login"文件中

技术分享

 

爬虫模拟登陆之formdata表单数据