1. 程式人生 > >python爬蟲學習之起點小說抓取

python爬蟲學習之起點小說抓取

info 心得 圖片 請求頭 http path req strong 修改

爬蟲學習的一點心得

任務:抓取某小說網站小說並下載

抓取:selenium

解析:xpath,正則表達式

遇到的問題:

1.用requests抓取的時候,無論如何修改請求頭,抓取的源代碼明顯缺失嚴重,特別是小說文本、鏈接地址等重要信息都無法獲取,最後萬不得已只能使用

selenium模擬瀏覽器(我這裏使用的火狐瀏覽器)進行抓取成功

技術分享圖片

python爬蟲學習之起點小說抓取