在 Windows 中通過 pip 安裝 Numpy,Scipy,Matplotlib,Pandas,StatsModels,Scikit-Learn,PyWavelets,Graphviz,TSNE
Numpy
Numpy 提供陣列支援,以及相應的高效處理函式。由於 Numpy 還是很多高階擴充套件庫的依賴庫,通常在安裝其他擴充套件庫之前,需要完成 Numpy 的安裝。
Downloads: 點選開啟連結
https://pypi.org/project/numpy/#files
在 Windows 中,可以通過 pip 安裝:
- 在 pip 所在目錄下開啟命令視窗,執行命令:
pip install numpy.whl
例:pip install numpy-1.14.3-cp36-none-win_amd64.whl
Note: 這裡下載的 wheel 檔案的檔名不可隨意更改,更改後可能出現錯誤:“xxx.whl is not a valid filename”
Scipy
Scipy 提供矩陣支援,以及矩陣相關的數值計算模組。Scipy 依賴於 Numpy ,因此安裝前需要先安裝 Numpy。
Downloads:點選開啟連結
https://github.com/scipy/scipy/releases
在 Windows 中,可以通過 pip 安裝:
- 在 pip 所在目錄下開啟命令視窗,執行命令:
pip install scipy.whl
Matplotlib
Matplotlib 是強大的資料視覺化工具,作相簿,主要用於二維繪圖和簡單的三維繪圖。通過 Matplotlib 可以快捷地用 Python 視覺化資料,並且輸出多種影象格式。
Matplotlib 的上級依賴庫相對較多,具體包括(建議如下順序安裝各個庫):
- numpy:下載地址 https://pypi.org/project/numpy/#files
- six: dateutil 和 cycler 依賴於 six 的 安裝。下載地址 https://pypi.org/project/six/#files
- dateutil:下載地址 https://pypi.org/project/python-dateutil/#files
- pytz:下載地址 https://pypi.org/project/pytz/#files
- pyparsing:下載地址 https://pypi.org/project/pyparsing/#files
- kiwisolver:下載地址 https://pypi.org/project/kiwisolver/#files
- setuptools:下載地址 https://pypi.org/project/setuptools/#files
- cycler:下載地址 https://pypi.org/project/Cycler/#files
部分依賴庫安裝示例如下:
在 Windows 中,可以通過 pip 安裝:
- 在 pip 所在目錄下開啟命令視窗,執行命令:
pip install xxx.whl
Note:出現 error “Could not find a version satisfies the requirments ... ... ”,則說明存在依賴庫未安裝成功。
以上依賴庫均安裝成功後,方可安裝 Matplotlib
在 Windows 中,可以通過 pip 安裝:
- 在 pip 所在目錄下開啟命令視窗,執行命令:
pip install matplotlib.whl
例:pip install matplotlib-2.2.2-cp36-cp36m-win_amd64.whl
安裝示例:
參考連結:
http://www.numpy.org/
http://www.scipy.org/
http://www.matplotlib.org/
Pandas
Pandas 主要用於資料的讀取和處理,帶有豐富的資料處理函式,支援時間序列分析功能,確實資料的處理等,是 Python 下最強大的資料分析和探索工具。Pandas 構建在 Numpy 之上。
在 Windows 中,可以通過 pip 安裝:
- 在 pip 所在目錄下開啟命令視窗,執行命令:
pip install pandas.whl
安裝完成後,需要安裝 xlrd 和 xlwt 庫才能支援 Excel 的讀寫:
安裝方法與其他庫相似,使用 pip 安裝,執行命令: pip install xlrd
pip install xlwt
Note:若要使用 pandas 讀取資料庫檔案 read_sql,需要知道以下依賴:依賴SQLAlchemy庫,而SQLAlchemy庫依賴於 PyMySQL。
Pandas在讀取資料(不管是csv、xls、sql),都是將全部資料讀入記憶體中,因此在資料量較大時難以實現。所以pandas提供了 chunksize引數,以分塊讀取大資料檔案。
StatsModels
StatsModels 主要用於資料的統計建模分析,支援與 Pandas 進行資料互動,其安裝依賴於 Pandas 和 patsy。
在 Windows 中,可以通過 pip 安裝:
- 在 pip 所在目錄下開啟命令視窗,執行命令:
pip install statsModels.whl
Pandas API REFERENCE:
Scikit-learn
Scikit-learn 提供了完善的機器學習工具箱,包括資料預處理、分類、迴歸、聚類、預測和模型分析等。Scikit-Learn 的安裝依賴於 Numpy、Scipy、Matplotlib。
Note: 依賴庫的安裝很重要,只有先把依賴庫安裝成功,然後安裝 scikit-learn 就會很容易
在 Windows 中,可以通過 pip 安裝:
- 在 pip 所在目錄下開啟命令視窗,執行命令:
pip install scikit-learn.whl
PyWavelets
StatsModels 是一個較全面的訊號處理庫,其安裝依賴於 Cython,Numpy,Matplotlib。
在 Windows 中,可以通過 pip 安裝:
- 在 pip 所在目錄下開啟命令視窗,執行命令:
pip install Pywavelets.whl
Graphviz
Graphviz 是一個跨平臺、基於命令列的繪圖工具。主要用於決策樹生成後的格式轉換,將決策樹匯出結果 “tree.dot” 轉換為 PDF或 PNG 等格式。
雙擊 .msi 檔案進行安裝,安裝完成後將 dot.exe 的目錄新增到系統環境變數
檢查安裝: dot -version
TSNE
TSNE 是聚類結果視覺化工具,提供有效的資料降維方式,可以在2 維或3 維的空間中展示聚類結果。其安裝依賴於 Cython,Numpy,Scipy
解壓並執行 setup.py 進行安裝