1. 程式人生 > >在 Windows 中通過 pip 安裝 Numpy,Scipy,Matplotlib,Pandas,StatsModels,Scikit-Learn,PyWavelets,Graphviz,TSNE

在 Windows 中通過 pip 安裝 Numpy,Scipy,Matplotlib,Pandas,StatsModels,Scikit-Learn,PyWavelets,Graphviz,TSNE

Numpy

Numpy 提供陣列支援,以及相應的高效處理函式。由於 Numpy 還是很多高階擴充套件庫的依賴庫,通常在安裝其他擴充套件庫之前,需要完成 Numpy 的安裝。

Downloads: 點選開啟連結  

                      https://pypi.org/project/numpy/#files

在 Windows 中,可以通過 pip 安裝:

  • 在 pip 所在目錄下開啟命令視窗,執行命令:

         pip install numpy.whl

例:pip install numpy-1.14.3-cp36-none-win_amd64.whl

Note: 這裡下載的 wheel 檔案的檔名不可隨意更改,更改後可能出現錯誤:“xxx.whl is not a valid filename”

Scipy

Scipy 提供矩陣支援,以及矩陣相關的數值計算模組。Scipy 依賴於 Numpy ,因此安裝前需要先安裝 Numpy。

Downloads:點選開啟連結

                       https://github.com/scipy/scipy/releases

在 Windows 中,可以通過 pip 安裝:

  • 在 pip 所在目錄下開啟命令視窗,執行命令:

         pip install scipy.whl

Matplotlib

Matplotlib 是強大的資料視覺化工具,作相簿,主要用於二維繪圖和簡單的三維繪圖。通過 Matplotlib 可以快捷地用 Python 視覺化資料,並且輸出多種影象格式。

Matplotlib 的上級依賴庫相對較多,具體包括(建議如下順序安裝各個庫):

  • numpy:下載地址  https://pypi.org/project/numpy/#files
  • six: dateutil 和 cycler 依賴於 six 的 安裝。下載地址  https://pypi.org/project/six/#files
  • dateutil:下載地址  https://pypi.org/project/python-dateutil/#files
  • pytz:下載地址  https://pypi.org/project/pytz/#files
  • pyparsing:下載地址  https://pypi.org/project/pyparsing/#files
  • kiwisolver:下載地址  https://pypi.org/project/kiwisolver/#files
  • setuptools:下載地址  https://pypi.org/project/setuptools/#files
  • cycler:下載地址  https://pypi.org/project/Cycler/#files

部分依賴庫安裝示例如下:

在 Windows 中,可以通過 pip 安裝:

  • 在 pip 所在目錄下開啟命令視窗,執行命令:

         pip install xxx.whl

Note:出現 error “Could not find a version satisfies the requirments ... ...  ”,則說明存在依賴庫未安裝成功。

以上依賴庫均安裝成功後,方可安裝 Matplotlib

在 Windows 中,可以通過 pip 安裝:

  • 在 pip 所在目錄下開啟命令視窗,執行命令:

         pip install matplotlib.whl

例:pip install matplotlib-2.2.2-cp36-cp36m-win_amd64.whl 

安裝示例:

參考連結:

http://www.numpy.org/

http://www.scipy.org/

http://www.matplotlib.org/

Pandas

Pandas 主要用於資料的讀取和處理,帶有豐富的資料處理函式,支援時間序列分析功能,確實資料的處理等,是 Python 下最強大的資料分析和探索工具。Pandas 構建在 Numpy 之上。

在 Windows 中,可以通過 pip 安裝:

  • 在 pip 所在目錄下開啟命令視窗,執行命令:

         pip install pandas.whl

安裝完成後,需要安裝 xlrdxlwt 庫才能支援 Excel 的讀寫:

安裝方法與其他庫相似,使用 pip 安裝,執行命令: pip install xlrd   

                                                                                              pip install xlwt

Note:若要使用 pandas 讀取資料庫檔案 read_sql,需要知道以下依賴:依賴SQLAlchemy庫,而SQLAlchemy庫依賴於 PyMySQL。

Pandas在讀取資料(不管是csv、xls、sql),都是將全部資料讀入記憶體中,因此在資料量較大時難以實現。所以pandas提供了 chunksize引數,以分塊讀取大資料檔案。

StatsModels

StatsModels 主要用於資料的統計建模分析,支援與 Pandas 進行資料互動,其安裝依賴於 Pandas 和 patsy。

在 Windows 中,可以通過 pip 安裝:

  • 在 pip 所在目錄下開啟命令視窗,執行命令:

         pip install statsModels.whl

Pandas API REFERENCE:

Scikit-learn

Scikit-learn 提供了完善的機器學習工具箱,包括資料預處理、分類、迴歸、聚類、預測和模型分析等。Scikit-Learn 的安裝依賴於 Numpy、Scipy、Matplotlib。

Note: 依賴庫的安裝很重要,只有先把依賴庫安裝成功,然後安裝 scikit-learn 就會很容易

        在 Windows 中,可以通過 pip 安裝:

  • 在 pip 所在目錄下開啟命令視窗,執行命令:

         pip install scikit-learn.whl

PyWavelets

StatsModels 是一個較全面的訊號處理庫,其安裝依賴於 Cython,Numpy,Matplotlib。

在 Windows 中,可以通過 pip 安裝:

  • 在 pip 所在目錄下開啟命令視窗,執行命令:

         pip install Pywavelets.whl

Graphviz

Graphviz 是一個跨平臺、基於命令列的繪圖工具。主要用於決策樹生成後的格式轉換,將決策樹匯出結果 “tree.dot”  轉換為 PDF或 PNG 等格式。

雙擊 .msi 檔案進行安裝,安裝完成後將 dot.exe 的目錄新增到系統環境變數

檢查安裝: dot -version

TSNE

TSNE 是聚類結果視覺化工具,提供有效的資料降維方式,可以在2 維或3 維的空間中展示聚類結果。其安裝依賴於 Cython,Numpy,Scipy

解壓並執行 setup.py 進行安裝