1. 程式人生 > >機器學習sklearn庫的使用--部署環境(python2.7 windows7 64bit)

機器學習sklearn庫的使用--部署環境(python2.7 windows7 64bit)

最近在學習機器學習的內容,難免地,要用到Scikit-learn(sklearn,下同)這一機器學習包。為了使用sklearn庫,我們需要安裝python2.7,pip install工具,numpy+mkl、scipy、pandas、sklearn等開源包。其中numpy+mkl和scipy安裝比較費勁,不能通過pip install工具直接安裝。
各檔案下載連結:
Python2.7.13 : Python2.7.13
numpy+mkl : numpy‑1.11.3+mkl‑cp27‑cp27m‑win_amd64.whl
Scipy:scipy‑0.19.1‑cp27‑cp27m‑win_amd64.whl

下載上述檔案之後首先按照步驟安裝Python27。重點來了,安裝numpy+mkl,下面介紹兩種方法:

  1. 進入到Python27安裝目錄,比如我的是:G:\Python\Scripts,在cmd介面進入到該目錄下。轉3
  2. 在環境變數path中加分號新增pip所在目錄G:\Python\Scripts,儲存後退出。轉3
  3. 然後輸入以下指令安裝pip工具:
 easy_install.exe pip
 pip install wheel
 pip install [numpy+mkl目錄]

此時很可能出現如下提示資訊:
numpy‑1.11.3+mkl‑cp27‑cp27m‑win_amd64.whl is not a supported wheel on this platform
Storing debug log for failure in C:\Users\Administrator\pip\pip.log網上研究後發現是由於pip安裝工具沒有更新的原因,所以使用pip指令更新:

pip install --upgrade setuptools
pip install --upgrade pip

然後輸入在命令列下輸入控制指令:

pip install wheel
pip install [numpy+m [Scipy目錄]kl目錄]

然後在Python27的Shell中輸入import numpy
如果輸出沒有錯誤,說明安裝沒有問題,繼續安裝Scipy。
在命令列輸入指令:pip install [scipy目錄],在Shell中輸入指令import scipy,如果輸出沒有錯誤,說明安裝沒有問題。
繼續安裝sklearn和panda,在命令列輸入指令:

pip install sklearn
pip install pandas

安裝完成後在Shell中輸入指令:

import sklearn
import pandas

如果輸出沒有錯誤,至此,sklearn庫安裝完成。
下面以簡單的鳶尾花資料集做一個簡單的測試,程式碼如下:

from sklearn.datasets import load_iris
from sklearn.preprocessing import Normalizer
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
iris = load_iris()
data = Normalizer().fit_transform(iris.data) #normalize the data
labels = iris.target
clf = DecisionTreeClassifier()
X_train,X_test,y_train,y_test = train_test_split(data,labels,test_size=0.2)
clf.fit(X_train,y_train)
y_pred = clf.predict(X_test)
accuracy = accuracy_score(y_test,y_pred)
print accuracy

執行結果:

>>> 
0.866666666667

測試成功,整個安裝過程結束。

相關推薦

機器學習sklearn的使用--部署環境python2.7 windows7 64bit

最近在學習機器學習的內容,難免地,要用到Scikit-learn(sklearn,下同)這一機器學習包。為了使用sklearn庫,我們需要安裝python2.7,pip install工具,numpy+mkl、scipy、pandas、sklearn等開源包。其

Python機器學習依賴的安裝numpy、scipy、sklearn

說到機器學習,相信大部分的研究者都是使用python來完成的,因為是實在太方便了,幾行程式碼就搞定了,比較前人做的研究都積累在那邊,所以今天我又重新安裝了python(還不是因為要做機器學習方面的實驗和luwn論文),so開始吧! 1、常用Python機器學習包 Numpy:用於科學計算的包

python機器學習-sklearn挖掘乳腺癌細胞

質量 mat spl tcl pytho 不同 區別 工具 state python機器學習-sklearn挖掘乳腺癌細胞( 博主親自錄制) 網易雲觀看地址 https://study.163.com/course/introduction.htm?courseId=10

python機器學習-sklearn挖掘乳腺癌細胞

糾正 plot 不錯 方法 eid right ref nump cores python機器學習-sklearn挖掘乳腺癌細胞( 博主親自錄制) 網易雲觀看地址 https://study.163.com/course/introduction.htm?courseId

BAT題 | 機器學習面試1000題系列第246~250題

246.對於神經網路的說法, 下面正確的是 :  1. 增加神經網路層數, 可能會增加測試資料集的分類錯誤率 2. 減少神經網路層數, 總是能減小測試資料集的分類錯誤率 3. 增加神經網路層數,

機器學習知識點查漏補缺隨機森林和extraTrees

efault 生成 xtra lac use sample strategy default lin 隨機森林 對數據樣本及特征隨機抽取,進行多個決策樹訓練,防止過擬合,提高泛化能力 一般隨機森林的特點: 1、有放回抽樣(所以生成每棵樹的時候,實際數據集會有重復),

機器學習知識點查漏補缺支持向量機

技巧 條件 blog 更多 nbsp pos .com 最優化 應該 一、模型概念 支持向量機的模型基本模型是建立在特征空間上的最大間隔線性分類器,通過使用核技巧,可以使它成為非線性分類器。 當訓練數據線性可分時,通過硬間隔最大化,學習一個線性分類器,即線性可分支持向量

機器學習筆記 -吳恩達第一章:緒論

0.機器學習定義   一個程式由經驗E中學習,解決任務T,達到效能度量值P,當且僅當,有了經驗值E後,經過P的評判,程式在處理T的時候經驗有所提升。 1.機器學習運用領域:         資料探勘

吳恩達機器學習邏輯迴歸python實現未正則化[對應ex2-ex2data2.txt資料集]

寫在前面: ​ 1.筆記重點是python程式碼實現,不敘述如何推導。參考本篇筆記前,要有邏輯迴歸的基礎(熟悉代價函式、梯度下降、矩陣運算和python等知識),沒有基礎的同學可通過網易雲課堂上吳恩達老師的機器學習課程學習。網上也有一些對吳恩達老師課後作業的python實現,大多數都是用

機器學習演算法簡介和程式碼P&R語言

  機器學習演算法,P&R語言 一般說來,機器學習有三種演算法: 1. 監督式學習 監督式學習演算法包括一個目標變數(因變數)和用來預測目標變數的預測變數(自變數)。通過這些變數我們可以搭建一個模型,從而對於一個已知的預測變數值,我們可以得到對應的目標變數值。重複訓練這

機器學習2:Naive Bayes樸素貝葉斯

參考:https://blog.csdn.net/syoya1997/article/details/78618885貝葉斯模型的講解 貝葉斯模型 ,二分類中展開為 P(H) – 已知的先驗概率 P(H|E) – 我們想求的後驗概率,即在B事件發生後對於事件A概率的評估

機器學習-實現簡單神經網路筆記和程式碼實現

一、神經網路簡介        神經網路演算法的發展歷史        起源:20世紀中葉,一種仿生學產品。        興起:環境->2進位制創新;能力->軟硬體;需求->人的價效比。        主要功能:            分類識別

Spark MLlib 機器學習演算法與原始碼解析網路課程—第一期

《Spark MLlib 機器學習演算法與原始碼解析》spark是一個開源叢集運算框架,最初是由加州大學柏克利分校AMPLab所開發。Spark使用了記憶體內運算技術,在記憶體上的運算速度比Hadoop

Ubuntu14.04上深度學習Caffe安裝指南CUDA7.5 + opencv3.1

Ubuntu14.04上Caffe安裝指南 安裝的準備工作 首先,安裝官方版Caffe時,如果要使用Cuda,需要確認自己確實有NVIDIA GPU。 安裝Ubuntu時,將/boot 分割槽分大概200M左右,太小了會導致升級系統時/boot空間不足

BAT機器學習面試1000題系列第76~149題

正文共43140個字,124張圖,預計閱讀時間:108分鐘。76、看你是搞視覺的,熟悉哪些CV框

機器學習實戰【5】SVM-支援向量機

本部落格記錄《機器學習實戰》(MachineLearningInAction)的學習過程,包括演算法介紹和python實現。 SVM(支援向量機) SVM是一種分類演算法,通過對訓練集資料的分析找到最好的分隔平面,然後用該平面對新資料進行分類。本

BAT機器學習面試1000題系列第150~279題

長文~可先收藏再看喲~150、在感知機中(Perceptron)的任務順序是什麼?深度學習 DL

TensorsFlow學習筆記3----面向機器學習初學者的MNIST教程MNIST For ML Beginners

記錄關鍵內容與學習感受。未完待續。。 面向機器初學者的MNIST教程(MNIST For ML Beginners) —–適用於對機器學習和tensorflow初學者。而這裡MNIST就好比學語言時候的列印hello world。 —–MNIS

機器學習筆記:決策樹ID3,C4.5,CART

學習資料:《統計學習方法》,《機器學習》(周志華),韓小陽ppt,鄒博ppt。 決策樹是一種樹形結構,對例項進行分類和迴歸的,下面主要說的是用來進行分類,最後說道CART的時候也會說到決策樹用到迴歸問題上。 1、決策樹模型與學習 先給出分類決策樹模型定義:是一種對例項資料進行

機器學習--手寫數字識別KNN、決策樹

KNN 及決策樹演算法為監督學習中的兩種簡單演算法。 KNN KNN演算法(鄰近演算法)的核心思想是如果一個樣本在特徵空間中的k個最相鄰的樣本中的大多數屬於某一個類別,則該樣本也屬於這個類別,並具有這個類別上樣本的特性。 歐式距離的計算公式: 假設每個樣本有兩個特徵值,如 A