網路爬蟲-模擬手機瀏覽器抓取資料

阿新 • • 發佈：2019-01-19

有些網站的資料在PC端很複雜，引數加密很嚴重，但是移動APP端的就沒那麼多加密，所以在遇到有些瓶頸的情況下，可以考慮從網頁端轉到移動端去抓包，爬取資料。這裡有兩種方法：

一. 使用模擬器下載APP

如果該網站有APP的話，推薦使用逍遙安卓模擬器，可以設定代理，使用fiddler進行抓包。

二.使用谷歌瀏覽器偽裝安卓/蘋果使用者

這種方式就比較簡單方便，直接修改chrome瀏覽器的user-agent為指定的機型即可。

這裡主要介紹一下第二種方法。

這裡寫圖片描述

可以看出移動端的介面比PC端的簡潔很多，抓包的時候也方便許多，可以過濾掉很多雜亂無章的js或者其他載入的資料。

如何設定修改chrome瀏覽器的user-agent

1.下載好最新版本的谷歌瀏覽器(我這裡的版本是v63)
2.將Google Chrome複製貼上一份，一個用來做正常PC端瀏覽器，一個用來模擬手機瀏覽器
3.右鍵單擊複製後的Google Chrome瀏覽器，選擇屬性
4.在Google Chrome的目標後新增以下程式碼(以我桌面的瀏覽器為例注意–user前面有一個空格)

安卓

"C:\Program Files (x86)\Google\Chrome\Application\chrome.exe" --user-agent="Mozilla/5.0 (Linux; U; Android 2.2; en-us; Nexus One Build/FRF91) AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1"

蘋果

"C:\Program Files (x86)\Google\Chrome\Application\chrome.exe" --user-agent="Mozilla/5.0 (iPad; U; CPU OS 3_2_2 like Mac OS X; en-us) AppleWebKit/531.21.10 (KHTML, like Gecko) Version/4.0.4 Mobile/7B500 Safari/531.21.10"

5.給該瀏覽器重新命名為安卓/蘋果瀏覽器(這一步可以忽略，主要是用來區分普通瀏覽器和偽裝瀏覽器)

接下來開啟瀏覽器可以發現已經變成安卓/蘋果瀏覽器介面了，有些網站沒有設定自適應螢幕，所以自行開啟開發者工具除錯一下解析度就OK了。

PS
這裡我還得吐槽一下樂桃航空，下訂單的時候必須支付完成之後才有訂單，說有支付寶方式支付但是找了半天，PC端和移動端都是沒有的！這讓我抓完包之後進行測試的時候如何是好~ 畢竟不敢真的將自己的信用卡號填上去

網路爬蟲-模擬手機瀏覽器抓取資料

一. 使用模擬器下載APP

二.使用谷歌瀏覽器偽裝安卓/蘋果使用者

如何設定修改chrome瀏覽器的user-agent

網路爬蟲-模擬手機瀏覽器抓取資料

【網路爬蟲】使用HttpClient4.3.5抓取資料

使用PHP curl模擬瀏覽器抓取網站信息

使用Selenium模擬瀏覽器抓取淘寶商品美食信息

Python爬蟲之使用正則表示式抓取資料

爬蟲的增量式抓取和資料更新

python3 使用selenium模擬登陸天眼查抓取資料

16-使用Selenium模擬瀏覽器抓取淘寶商品美食資訊

python 爬蟲：利用selenium抓取cookie進行模擬登陸

Python爬蟲練習之一：抓取美團資料

利用“爬蟲”抓視訊法院審結全國首例計算機抓取資料案

python爬蟲"Hello World"級入門例項（二）,使用json從中國天氣網抓取資料

python 爬蟲（四）抓取Ajax資料

htmlunit做爬蟲繞過驗證碼抓取網站資料

Python爬蟲入門教程 17-100 部落格抓取資料

wireshark網路抓取資料包分析

java爬蟲抓取資料，儲存為excel檔案

python爬蟲使用BeautifulSoup庫簡單快速抓取資料

使用Selenium模擬瀏覽器抓取

linux下使用crontab設定scrapy爬蟲定時抓取資料

網路爬蟲-模擬手機瀏覽器抓取資料

一. 使用模擬器下載APP

二.使用谷歌瀏覽器偽裝安卓/蘋果使用者

如何設定修改chrome瀏覽器的user-agent

相關推薦