一、scrapy框架
1.什麼是scrapy:
爬蟲中封裝好的一個明星框架。功能:高效能的持久化儲存,非同步的資料下載,高效能的資料解析,分散式。
2.使用方法:
安裝:
下載tiwisted,此處位下載地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted
安裝tiwisted,pip install tiwisted-xxxx
安裝pywin32:pip install pywin32
安裝scrapy:pip install scrapy
安裝完成後在終端輸入scrapy如果沒有報錯即安裝成功。
建立專案:
輸入 scrapy startprojet projectName 建立專案
建立爬蟲檔案:cd至spiders資料夾下,在終端輸入 scrapy genspider spidername www.xxx.com 用以建立爬蟲檔案。