1. 程式人生 > >Python2.7下安裝Scrapy框架

Python2.7下安裝Scrapy框架

由於畢業設計的要求,需要在網站上抓取大量的資料,那麼使用Scrapy框架可以讓這一過程變得簡單不少,畢竟Scrapy是一個為了爬去網站資料、提取結構性資料而編寫的應用框架。於是,便開始了我的安裝Scrapy框架之旅。可以說這個過程並不是很愉快,各種錯誤各種出,不過到最後,終於安裝上了Scrapy框架。下面總結一下我的Scrapy框架的安裝。

1.安裝python2.7

由於Scrapy不支援Python3.0,於是我解除安裝了Python3.0,又重新安裝了Python2.7(python2.7安裝包),在安裝Python2.7的時候,會有一個自動設定環境變數的選項,建議在這裡將選項選上,省下後期自己新增環境變數。我們後期自己新增環境變數,就是根據自己實際安裝的路徑,在系統的環境變數path中新增這兩條語句就可以。

這裡寫圖片描述

在配置完環境之後,我們測試一下我們是否安裝配置環境成功。只要在cmd中輸入 python –version ,然後能夠顯示正確的python版本就可以了。如果未能顯示,則重啟一下cmd試試。

這裡寫圖片描述

2.安裝pywin32

在安裝配置好python2.7之後,我們還不能直接安裝Scrapy,我們首先需要安裝Scrapy依賴的幾個工具。接下來安裝pywin32(pywin32安裝包),這個軟體安裝的時候一直next就可以了。

3.安裝pip

pip實際上一款比較方便的線上軟體安裝工具,類似於easy install,我們現在安裝pip,在之後的軟體安裝的時候我們就可以使用 pip install 命令了。首先我們要下載get-pip.py(

get-pip.py檔案) ,下載完成之後,我們在cmd下進行安裝,首先切換到檔案所在目錄,然後輸入python get-pip.py語句,便可以進行安裝了,但是最頭疼的問題出現了,由於該檔案會將一些配置檔案自動寫入到我們的C盤使用者檔案目錄下,而我的使用者目錄是中文名,就會產生編碼異常。

這裡寫圖片描述

在查詢一番資料之後,終於將問題解決了,為了解決中文路徑的問題,我們只需要在 D:\python27\Lib\site-packages的目錄下新建一個名為
sitecustomize.py的檔案即可。

這裡寫圖片描述

然後在檔案內輸入以下程式碼:

import sys
reload(sys)
sys.setdefaultencoding
('gbk')

當然不一定一定要設定為gbk編碼,這個根據自己的電腦的編碼來設定。這樣我們的中文路徑問題就算解決了,我們在重啟cmd,在執行安裝pip語句之後,pip便順利完成了。安裝完成之後,我們可以進行一下檢驗,在cmd中輸入pip –version,如果顯示正確的版本號則說明正確。

這裡寫圖片描述

4.安裝lxml

在安裝完成pip之後,本想可以輕鬆的使用pip install lxml命令來進行安裝,但是意外發生了,由於使用pip需要vc2008的環境,而且只能是2008的,2013的都不行。沒辦法為了使用這款工具,只能在去求教度娘,終於找到了解決辦法,原來微軟給我們提供了VcForPython(VCForPython安裝包),這樣我們就不用安裝VC2008了,這樣之後,我們便可以使用 pip install lxml進行安裝了。

5.安裝pyOpenSSL

在安裝這個工具的時候我們便可以使用 pip install pyOpenSSL 語句來進行安裝了,安裝的速度取決於網速了。

6.安裝Scrapy

終於經歷一波坎坷之後,我們終於可以安裝Scrapy框架了,在cmd中輸入 pip install Scrapy命令之後,我們就可以等著享受成功的喜悅了。在安裝完成之後,我們在cmd中輸入Scrapy來檢測一下,是否真正的安裝成功。

這裡寫圖片描述

終於安裝好了,還是有點成就感的。