一、scrapy框架

  1.什麼是scrapy:

   爬蟲中封裝好的一個明星框架。功能:高效能的持久化儲存,非同步的資料下載,高效能的資料解析,分散式。

  2.使用方法:

   安裝:

    下載tiwisted,此處位下載地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

    安裝tiwisted,pip install tiwisted-xxxx

    安裝pywin32:pip install pywin32 

    安裝scrapy:pip install scrapy

    安裝完成後在終端輸入scrapy如果沒有報錯即安裝成功。

    建立專案:

      輸入 scrapy startprojet projectName 建立專案

  建立爬蟲檔案:cd至spiders資料夾下,在終端輸入 scrapy genspider spidername www.xxx.com 用以建立爬蟲檔案。