1. 程式人生 > >Scrapy爬蟲執行中yield請求未被丟擲(或丟擲未執行)解決方法(親測有效)

Scrapy爬蟲執行中yield請求未被丟擲(或丟擲未執行)解決方法(親測有效)

當我們在執行scrapy除錯的時候可能會遇到yield請求未正確丟擲的情況。

1、檢視scrapy執行日誌

日誌中的這一項表示,我們的請求被過濾掉了20條。

解決方法:

1、將我們的請求ip地址域名(如:blog.csdn.net)新增到spider爬蟲檔案的allowed_domains陣列中

(另外:我們的允許請求域名中,域名後不需要新增‘/’號,否則會將我們正常的請求過濾掉)

2、在我們的yield Request請求中新增

dont_filter=True

再次執行爬蟲檔案即可正常執行,並進行下一個請求的獲取和執行。