1. 程式人生 > >windows下使用scikit-learn學習機器學習——安裝和配置

windows下使用scikit-learn學習機器學習——安裝和配置

style weight 這一 策略 學習資料 scipy 錯誤 erl pycharm

  環境搭建過程挺麻煩...但終於是弄好了,先給一些過程中參考的比較重要的資料(找微軟的機器學習資料是個人摸索經驗,無任何借鑒):

    1.如果嫌網上各種numpy、scipy等等包的安裝教程麻煩的話就直接去:微軟機器學習服務器進行下載安裝,途中可能會遇到一些問題,主要是powershell的權限問題,可以到微軟的官方文檔:powershell執行策略問題找到解決方案。成功能夠運行powershell腳本的權限後可能還是會有這樣的問題:

無法加載文件:"...",未對文件"..."進行數字簽名,無法在當前系統上運行該腳本。

    這時我們不要急,找到powershell腳本,點擊右鍵->屬性。可能會在下方看到一句類似"該腳本可能無法在當前系統運行",然後旁邊有一個解鎖腳本(貌似叫這個)的勾選框,勾選即可。然後,再用管理員身份運行powershell並執行腳本就能成功運行了:

技術分享圖片

      然後就一直等待下載完畢。至於為什麽就下載這一個就可以了,上面鏈接裏面有提到:

技術分享圖片

      其實版本應該都是最新版的,於是,弄好以後按照Anaconda的使用方法再按自己需求安裝的各種包等等就好了。

      到GitHub scikit-learn下載scikit-learn,安裝方法等等鏈接裏面都有,我就不多說了。

    2.就按照網上其他的辦法去安裝。

      這個就自己去網上查資料,找辦法了,我給出一些可能有用的資料吧:

http://scikit-learn.org/stable/index.html
https://www.anaconda.com/download/#windows
https://www.scipy.org/install.html
https://pypi.python.org/pypi/pip
https://pypi.python.org/pypi/numpy
http://www.numpy.org/
http://blog.csdn.net/m53931422/article/details/42489897

      如果感覺都弄好了可以測試一下:

      在存放sklearn文件的目錄下運行cmd,鍵入命令:

pytest sklearn

      然後回車,如果沒有出現找不到的提示和一些錯誤就應該沒問題,或者用cmd打開python,鍵入:

import sklearn

      然後回車,如果沒有出現任何問題,只是轉行,就說明沒問題了。

      其他幾個包也一樣可以用上面的方法檢測。

      查看自己安裝的包的版本可以使用下面的命令:

        1.如果有pip.exe的話:

pip list

        2.Anaconda:

conda list

  

  整個安裝和配置過程我就說這麽多了,這個過程可能會很多次失敗...但為了學習到更多的東西,還是得耐心的一步一步的測試和找原因。

  註意:我用的windows 10,可能我的解決辦法並不能適用所有情況。

  下面是我的第一個機器學習的例子:

#參考博客:http://www.cnblogs.com/magle/p/5878967.html

import numpy as np
import matplotlib.pyplot as plt
from sklearn import linear_model

# X is the 10x10 Hilbert matrix
X = 1. / (np.arange(1, 11) + np.arange(0, 10)[:, np.newaxis])
y = np.ones(10)

###############################################################################
# Compute paths

n_alphas = 200
alphas = np.logspace(-10, -2, n_alphas)
clf = linear_model.Ridge(fit_intercept=False)

coefs = []
for a in alphas:
    clf.set_params(alpha=a)
    clf.fit(X, y)
    coefs.append(clf.coef_)

###############################################################################
# Display results

ax = plt.gca()
ax.set_color_cycle([‘b‘, ‘r‘, ‘g‘, ‘c‘, ‘k‘, ‘y‘, ‘m‘])

ax.plot(alphas, coefs)
ax.set_xscale(‘log‘)
ax.set_xlim(ax.get_xlim()[::-1])  # reverse axis
plt.xlabel(‘alpha‘)
plt.ylabel(‘weights‘)
plt.title(‘Ridge coefficients as a function of the regularization‘)
plt.axis(‘tight‘)
plt.show()

  運行結果:

技術分享圖片

   我本來想用PyCharm寫的,但並不能導入那些包,等我再琢磨琢磨怎麽才能用PyCharm來寫 機器學習-Python。

   最後,通過這幾次的探索學習發現,如果學習上遇到困難,第一時間找官方文檔和一些相關論文能更好的節省時間並解決問題。

--------------------------------------update 2018-01-01 20:03:17--------------------------------------

  之後又查了以下powershell對腳本的一些執行相關的東西,找到一篇不錯的文章,雖然官方文檔都有說明,但沒有太多測試用例,於是想把鏈接放在這裏:

http://www.pstips.net/powershell-scripts-signature.html

  

  

windows下使用scikit-learn學習機器學習——安裝和配置