1. 程式人生 > >scrapy基礎知識之 關於爬蟲部分一些建議:

scrapy基礎知識之 關於爬蟲部分一些建議:

限制 支持 結束 攜程 target 經理 框架 實際應用 分享

1.盡量減少請求次數,能抓列表頁就不抓詳情頁,減輕服務器壓力,程序員都是混口飯吃不容易。

2.不要只看 Web 網站,還有手機 App 和 H5,這樣的反爬蟲措施一般比較少。

3.實際應用時候,一般防守方做到根據 IP 限制頻次就結束了,除非很核心的數據,不會再進行更多的驗證,畢竟成本的問題會考慮到。

4.如果真的對性能要求很高,可以考慮多線程(一些成熟的框架如 Scrapy都已支持),甚至分布式..

https://segmentfault.com/a/1190000005840672(攜程技術中心 - 攜程酒店研發部研發經理崔廣宇 <爬蟲與反爬蟲> 技術分享)

scrapy基礎知識之 關於爬蟲部分一些建議: