1. 程式人生 > >爬蟲模擬登陸之formdata表單數據

爬蟲模擬登陸之formdata表單數據

name 圖片 智聯招聘 字段名 img 1-1 格式 都是 blog

首先HTTP協議是個無連接的協議,瀏覽器和服務器之間是以循環往復的請求回復來交互的,交互的形式是以文件形式來進行的。比如在chrome開發者工具network中看到了

技術分享

每一行是一個文件,又文件大小啊,文件類型啊,比如腳本,圖片等。

根據協議,把每個文件的內容按照協議格式填入HTTP數據協議結構,其中,對於爬蟲模擬登陸來說最重要的是表單數據formdata這個字段

技術分享

在這我們看到又loginname字段,又password字段,我們看到這都是明碼,所以做了遮擋。我們得到了這個,就可以根據字段名稱自己組裝數據了,

另外還需要註意的是,formdata所在的文件,前面我們說了,瀏覽器與服務器之間是以文件形式交互的,開發者工具也是以文件為單位來抓包的,所以我們需要找對文件

這個只能自己找了,比如知乎,包含賬號密碼的表單數據存在與“email"文件中,比如在智聯招聘中,包含賬號密碼的表單數據存在與“login"文件中

技術分享

爬蟲模擬登陸之formdata表單數據