1. 程式人生 > >scrapy框架中在middleware中進行配置user-agent,將user-agent進行隨機

scrapy框架中在middleware中進行配置user-agent,將user-agent進行隨機

在scrapy中進行user-agent配置,將其進行隨機更換。

下面所寫為學習筆記

使用scrapy進行爬蟲的時候,一些針對爬蟲設定了一些反爬措施,最明顯的是user-agent。

一、在setting檔案中ctrl+f找到 DOWNLOADER_MIDDLEWARES,將其註釋的部分取消掉,為了啟用中介軟體。

這部分在scrapy文件中可以閱讀到。

二、開啟middlewares檔案新建class類

class RandomUserAgentMiddlware(object):

三、呼叫super方法進行初始化

同時在setting中進行新增RANDOM_UA_TYPE=“random”

四、