1. 程式人生 > >動態ip代理:反網絡爬蟲之設置User-Agent的常規方法

動態ip代理:反網絡爬蟲之設置User-Agent的常規方法

大量 cto sha mark 瀏覽器 想要 爬蟲 http rom

動態ip代理:反網絡爬蟲之設置User-Agent的常規方法

爬蟲過程中的反爬措施非常重要,其中設置隨機 User-Agent 是一項重要的反爬措施。常規情況,比較方便的方法是利用 fake_useragent包,這個包內置大量的 UA 可以隨機替換,這比自己去搜集羅列要方便很多,下面來看一下如何操作。

1.首先,安裝好fake_useragent包,一行代碼搞定:
技術分享圖片
2.可以測試一下
技術分享圖片
3.這裏,使用了 ua.random 方法,可以隨機生成各種瀏覽器的 UA,見下圖:
技術分享圖片
4.如果只想要某一個瀏覽器的,比如 Chrome ,那可以改成 ua.chrome,再次生成隨機 UA 查看一下:
技術分享圖片

重要提示
反爬除了以上措施,還有一個很重要的就是識別一些代理ip的使用

不過如果是使用諸如太陽換ip軟件一類的專業工具,高匿性質強,那就很難識別了。

動態ip代理:反網絡爬蟲之設置User-Agent的常規方法