Python機器學習庫sklearn裡利用感知機進行三分類（多分類）的原理

阿新 • • 發佈：2019-01-05

from IPython.display import Image  
%matplotlib inline  
# Added version check for recent scikit-learn 0.18 checks  
from distutils.version import LooseVersion as Version  
from sklearn import __version__ as sklearn_version  
  
from sklearn import datasets  
import numpy as np  
iris = datasets.load_iris() #http://scikit-learn.org/stable/auto_examples/datasets/plot_iris_dataset.html  
X = iris.data[:, [2, 3]]  
y = iris.target  #取species列，類別  
  
if Version(sklearn_version) < '0.18':  
    from sklearn.cross_validation import train_test_split  
else:  
    from sklearn.model_selection import train_test_split  
X_train, X_test, y_train, y_test = train_test_split(  
    X, y, test_size=0.3, random_state=0)  #train_test_split方法分割資料集  
  
from sklearn.preprocessing import StandardScaler  
sc = StandardScaler()   #初始化一個物件sc去對資料集作變換  
sc.fit(X_train)   #用物件去擬合數據集X_train，並且存下來擬合引數  
X_train_std = sc.transform(X_train)  
X_test_std = sc.transform(X_test)  

from sklearn.linear_model import Perceptron
#http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.Perceptron.html#sklearn.linear_model.Perceptron
#ppn = Perceptron(n_iter=40, eta0=0.1, random_state=0)
ppn = Perceptron()  #y=w.x+b
ppn.fit(X_train_std, y_train)

#驗證perceptron的原理
def prelabmax(X_test_std):
    pym=[]
    for i in range(X_test_std.shape[0]):
        py=np.dot(ppn.coef_,X_test_std[i,:].T)+ppn.intercept_
        pym.append(max(py))
    return pym
prelabmax(X_test_std)   

def prelabindex(X_test_std,pym):
    index=[]
    for i in range(X_test_std.shape[0]):
        py=np.dot(ppn.coef_,X_test_std[i,:].T)+ppn.intercept_
        pymn=pym[i]
        for j in range(3):
            if py[j]==pymn:
                index.append(j)
    return np.array(index)
pym=prelabmax(X_test_std)
prelabindex(X_test_std,pym)
prelabindex(X_test_std,pym)==ppn.predict(X_test_std)
#Output:array([ True,  True,  True,  True,  True,  True,  True,  True,  True,
#               True,  True,  True,  True,  True,  True,  True,  True,  True,
#               True,  True,  True,  True,  True,  True,  True,  True,  True,
#               True,  True,  True,  True,  True,  True,  True,  True,  True,
#               True,  True,  True,  True,  True,  True,  True,  True,  True], dtype=bool)

即選擇y=wx+b值最大的項所在的組為其類別

Python機器學習庫sklearn裡利用感知機進行三分類（多分類）的原理

from IPython.display import Image %matplotlib inline # Added version check for recent scikit-learn 0.18 checks from distutils.vers

Python機器學習庫sklearn裡利用LR模型進行三分類（多分類）的原理

首先，LR將線性模型利用sigmoid函式進一步做了非線性對映。將分類超平面兩側的正負樣本點，通過壓縮函式轉化成了以0.5為分解的兩類：類別0和類別1。這個轉化過程見下圖：上圖給出的是線性邊界與LR分佈函式（即sigmoid函式）的對映對應關係；同樣，對於非線

python機器學習庫sklearn——Lasso迴歸（L1正則化）

Lasso The Lasso 是估計稀疏係數的線性模型。它在一些情況下是有用的，因為它傾向於使用具有較少引數值的情況，有效地減少給定解決方案所依賴變數的數量。因此，Lasso 及其變體是壓縮感知領域的基礎。在一定條件下，它可以恢復一組非零權重的

python機器學習庫sklearn——樸素貝葉斯分類器

在scikit-learn中，一共有3個樸素貝葉斯的分類演算法類。分別是GaussianNB，MultinomialNB和BernoulliNB。其中GaussianNB就是先驗為高斯分佈的樸素貝葉斯，MultinomialNB就是先驗為多項式分佈的樸素

python機器學習庫sklearn——K最近鄰、K最近鄰分類、K最近鄰迴歸

這裡只講述sklearn中如何使用KNN演算法。無監督最近鄰 NearestNeighbors （最近鄰）實現了 unsupervised nearest neighbors learning（無監督的最近鄰學習）。它為三種不同的最近鄰演算法

Python機器學習庫SKLearn：資料集轉換之預處理資料

資料集轉換之預處理資料：將輸入的資料轉化成機器學習演算法可以使用的資料。包含特徵提取和標準化。原因：資料集的標準化（服從均值為0方差為1的標準正態分佈（高斯分佈））是大多數機器學習演算法的常見要求。如果原始資料不服從高斯分佈，在預測時

Python機器學習庫sklearn幾種迴歸演算法建模及分析(實驗)

最簡單的迴歸模型就是線性迴歸資料匯入與視覺化分析 from IPython.display import Image %matplotlib inline # Added version che

Python機器學習庫sklearn網格搜尋與交叉驗證

網格搜尋一般是針對引數進行尋優，交叉驗證是為了驗證訓練模型擬合程度。sklearn中的相關API如下：（1）交叉驗證的首要工作：切分資料集train/validation/test A.)沒指定資料切分方式，直接選用cross_val_scor

python機器學習庫sklearn——支援向量機svm

支援向量機的優勢在於: 在高維空間中非常高效.即使在資料維度比樣本數量大的情況下仍然有效. 在決策函式（稱為支援向量）中使用訓練集的子集,因此它也是高效利用記憶體的. 通用性: 不同的核函式與特定的決策函式一一對應.常見的 kernel 已經提供,也

Python：機器學習庫 sklearn

安裝： pip install -U scikit-learn 資料標準化 from sklearn import preprocessing a = np.array([[10, 2.7, 3.6], [-100, 5, -2],

基於python的機器學習庫Sklearn

scikit-learn，也稱為sklearn，是基於python的機器學習庫，可以方便進行機器學習演算法的實施，包括：分類、迴歸、聚類、降維、模型選擇和預處理等資料探勘的相關演算法。下面是對官方文件進行學習的收穫，以程式碼的形式將官方文件的內容翻譯記錄

[機器學習]基於python的機器學習庫Sklearn-01

1.1 廣義線性模型以下介紹的方法均是用於求解迴歸問題,其目標值預計是輸入值的一個線性組合.用數學語言表示: 假設y是預測值,則有: 在本節中,稱向量:為係數. 若要講通用的線性模型用於分類問題,可以參考Logistic迴歸 1.1.1

Python機器學習庫scikit-learn實踐

.get new 安裝 gis 支持兩個 clas mod 神經網絡一、概述機器學習算法在近幾年大數據點燃的熱火熏陶下已經變得被人所“熟知”，就算不懂得其中各算法理論，叫你喊上一兩個著名算法的名字，你也能昂首挺胸脫口而出。當然了，算法之林雖大，但能者還是

2018年最受歡迎Python機器學習庫介紹

Python Python開發 Python全棧機器學習庫 Python是一種面向對象的解釋型計算機程序設計語言，具有豐富和強大的庫，再加上其簡單、易學、速度快、開源免費、可移植性、可擴展性以及面向對象的特點，Python成為2017年最受歡迎的最受歡迎的編程語言！人工智能是當前最

比較好的Python機器學習庫有哪些？

Python是一種面向物件的解釋型計算機程式設計語言，具有豐富和強大的庫，再加上其簡單、易學、速度快、開源免費、可移植性、可擴充套件性以及面向物件的特點，Python成為2017年最受歡迎的最受歡迎的程式語言！人工智慧是當前最熱門話題之一，機器學習技術是人工智慧實現必備技能，Python程式語

python機器學習庫——結巴中文分詞

結巴中文分詞安裝： pip install jieba1 特點：支援三種分詞模式：精確模式，試圖將句子最精確地切開，適合文字分析；全模式，把句子中所有的可以成詞的詞語都掃描出來, 速度非常快，但是不能解決歧義；搜尋引擎模式，在精確

python機器學習庫的使用

常見機器學習演算法名單 1.線性迴歸線性迴歸通常用於根據連續變數估計實際數值（房價、呼叫次數、總銷售額等）。我們通過擬合最佳直線來建立自變數和因變數的關係。這條最佳直線叫做迴歸線，並且用 Y= a *X + b 這條線性等式來表示。理解線性迴歸的最好辦法是回顧一下童年。

Python機器學習庫scikit-learn

概述 scikit-learn 是機器學習領域非常熱門的一個開源庫，基於Python 語言寫成。可以免費使用。而且使用非常的簡單，文件感人，非常值得去學習。下面是一張scikit-learn的圖譜：我們可以看到，機器學習分為四大塊，分別是 cla

python機器學習庫xgboost——xgboost演算法

安裝更新：現在已經可以通過pip install xgboost線上安裝庫了。 xgboost簡介 xgboost一般和sklearn一起使用，但是由於sklearn中沒有整合xgboost，所以才需要單獨下載安裝。 xgboost是在GB

python機器學習庫scikit-learn簡明教程之：SVM支援向量機

1.獲得樣例資料 scikit-learn庫有一些標準的資料集，例如分類的數字集，波士頓房價迴歸資料集。在下面，我們啟動Python直譯器，然後載入資料集。我們可以認為，美元符號後輸入python然

Python機器學習庫sklearn裡利用感知機進行三分類（多分類）的原理

相關推薦