1. 程式人生 > >Python爬蟲入門之使用Redis+Flask維護動態代理池

Python爬蟲入門之使用Redis+Flask維護動態代理池

代理池的要求

  • 多站抓取, 非同步檢測
  • 定時篩選, 持續更新
  • 提供介面, 易於提取

代理池架構

這裡寫圖片描述

程式碼

程式碼放到github上了,稍微修改了一點,可以正常運行了.有問題評論留言討論.

分為兩種ProxyPoolPopProxyPoolPro. 第一種是用完ip就扔掉,第二種反覆利用.地址如下: