1. 程式人生 > >爬蟲scrapy框架安裝使用

爬蟲scrapy框架安裝使用

目錄結構 spi 創建 信息 目錄 結構 win 框架 命令

安裝: pip install scrapy

安裝可能會出現問題,此時需要下載一個依賴包

在 這個網站: https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

技術分享圖片

下載對應版本,,註意,,python3.6 adm64位對應技術分享圖片

    pip install 文件的完成路徑

安裝成功後

開始使用:

  創建項目:scrapy startproject 項目名

  目錄結構如下:

    技術分享圖片

  生成爬蟲文件:終端cd進入到 first目錄下

      執行命令:scrapy genspider  文件名(name) 網站網址(url)

  運行爬蟲:終端cd到spiders目錄下

      執行命令:scrapy crawl name

      在此過程會遇到一些問題

          (1)需要安裝pywin32

          (2)需要配置setting文件

            (a)把True改為False,不遵從robots協議

             技術分享圖片

            (b)創建頭部信息技術分享圖片

現在可以執行了

    

  

爬蟲scrapy框架安裝使用