windows下使用scikit-learn學習機器學習——安裝和配置
環境搭建過程挺麻煩...但終於是弄好了,先給一些過程中參考的比較重要的資料(找微軟的機器學習資料是個人摸索經驗,無任何借鑒):
1.如果嫌網上各種numpy、scipy等等包的安裝教程麻煩的話就直接去:微軟機器學習服務器進行下載安裝,途中可能會遇到一些問題,主要是powershell的權限問題,可以到微軟的官方文檔:powershell執行策略問題找到解決方案。成功能夠運行powershell腳本的權限後可能還是會有這樣的問題:
無法加載文件:"...",未對文件"..."進行數字簽名,無法在當前系統上運行該腳本。
這時我們不要急,找到powershell腳本,點擊右鍵->屬性。可能會在下方看到一句類似"該腳本可能無法在當前系統運行",然後旁邊有一個解鎖腳本(貌似叫這個)的勾選框,勾選即可。然後,再用管理員身份運行powershell並執行腳本就能成功運行了:
然後就一直等待下載完畢。至於為什麽就下載這一個就可以了,上面鏈接裏面有提到:
其實版本應該都是最新版的,於是,弄好以後按照Anaconda的使用方法再按自己需求安裝的各種包等等就好了。
到GitHub scikit-learn下載scikit-learn,安裝方法等等鏈接裏面都有,我就不多說了。
2.就按照網上其他的辦法去安裝。
這個就自己去網上查資料,找辦法了,我給出一些可能有用的資料吧:
http://scikit-learn.org/stable/index.html https://www.anaconda.com/download/#windows https://www.scipy.org/install.html https://pypi.python.org/pypi/pip https://pypi.python.org/pypi/numpy http://www.numpy.org/ http://blog.csdn.net/m53931422/article/details/42489897
如果感覺都弄好了可以測試一下:
在存放sklearn文件的目錄下運行cmd,鍵入命令:
pytest sklearn
然後回車,如果沒有出現找不到的提示和一些錯誤就應該沒問題,或者用cmd打開python,鍵入:
import sklearn
然後回車,如果沒有出現任何問題,只是轉行,就說明沒問題了。
其他幾個包也一樣可以用上面的方法檢測。
查看自己安裝的包的版本可以使用下面的命令:
1.如果有pip.exe的話:
pip list
2.Anaconda:
conda list
整個安裝和配置過程我就說這麽多了,這個過程可能會很多次失敗...但為了學習到更多的東西,還是得耐心的一步一步的測試和找原因。
註意:我用的windows 10,可能我的解決辦法並不能適用所有情況。
下面是我的第一個機器學習的例子:
#參考博客:http://www.cnblogs.com/magle/p/5878967.html import numpy as np import matplotlib.pyplot as plt from sklearn import linear_model # X is the 10x10 Hilbert matrix X = 1. / (np.arange(1, 11) + np.arange(0, 10)[:, np.newaxis]) y = np.ones(10) ############################################################################### # Compute paths n_alphas = 200 alphas = np.logspace(-10, -2, n_alphas) clf = linear_model.Ridge(fit_intercept=False) coefs = [] for a in alphas: clf.set_params(alpha=a) clf.fit(X, y) coefs.append(clf.coef_) ############################################################################### # Display results ax = plt.gca() ax.set_color_cycle([‘b‘, ‘r‘, ‘g‘, ‘c‘, ‘k‘, ‘y‘, ‘m‘]) ax.plot(alphas, coefs) ax.set_xscale(‘log‘) ax.set_xlim(ax.get_xlim()[::-1]) # reverse axis plt.xlabel(‘alpha‘) plt.ylabel(‘weights‘) plt.title(‘Ridge coefficients as a function of the regularization‘) plt.axis(‘tight‘) plt.show()
運行結果:
我本來想用PyCharm寫的,但並不能導入那些包,等我再琢磨琢磨怎麽才能用PyCharm來寫 機器學習-Python。
最後,通過這幾次的探索學習發現,如果學習上遇到困難,第一時間找官方文檔和一些相關論文能更好的節省時間並解決問題。
--------------------------------------update 2018-01-01 20:03:17--------------------------------------
之後又查了以下powershell對腳本的一些執行相關的東西,找到一篇不錯的文章,雖然官方文檔都有說明,但沒有太多測試用例,於是想把鏈接放在這裏:
http://www.pstips.net/powershell-scripts-signature.html
windows下使用scikit-learn學習機器學習——安裝和配置