機器學習：支援向量機(SVM)

阿新 • • 發佈：2019-01-03

1. 理論

概述：

利用訓練集在特徵空間中求出一個分類超平面(w,b)把樣本切割開，依靠該超平面對新樣本進行分類。如果訓練集在當前的特徵空間中無法分割，則用核技術的對映函式把原特徵空間對映到高緯或者無窮維空間再切割。

基本概念：

超平面：

用(w,b)表示， w1*x1 + w2*x2 +...+ wn*xn = 0 表示在特徵空間中的一個平面。需要注意的是，一個平面可以對應多個(w,b)。

函式距離（間隔）：

點到超平面的函式距離： y_i(w * x_i) 
集合到超平面的函式距離： 集合中的點到超平面的函式距離的最小值

幾何距離（間隔）：

點到超平面的幾何距離： 函式距離/||w||
集合到超平面的幾何距離： 集合中的點到超平面的幾何距離的最小值

線性可分SVM

線性SVM就是在訓練集中尋找一個幾何間隔最大的超平面(w,b)作為分類平面，轉化為如下最優化問題：

$linearSVM$
$linearSVM$

其中gamma‘為訓練集到超平面的函式距離。但是，該問題求出的一個超平面可以有很多種(w, b)的表示形式。換句話說，存在無數個(w,b)滿足最優，但是這些(w, b)都表示一個超平面。因此需要加上如下約束：

$linearSVM$

該優化問題等價為如下形式：

$linearSVM$
$linearSVM$

但是訓練集合一般都存在一定的噪聲，我們允許超平面將部分的點分類錯誤。加入鬆弛變數e和懲罰因子C, 就得到了最終形式：

$linearSVM$
$linearSVM$

那個min優化目標函式就是SVM的風險函式，求解過程就是訓練過程。之後用最優化演算法求解該問題即可，一般使用拉格朗日乘子法，實現的時候SMO演算法求解。

非線性SVM於核函式

絕大多數情況下訓練集無法線性可分，這個時候需要用某種對映把當前的特徵空間對映到高維的特徵空間中，在新特徵空間中就線性可分。

核函式定義：

設X是原特徵空間，H是新的高維或無限維的特徵空間，若存在一個從X到H的對映

    f(x): X->H

使得對所有x,z屬於X，函式K(x,z)滿足：

    K(x,z) = f(x)f(z)  ( 這裡是內積 )

則稱K(x,z) 為對映f的核函式。

注意：核函式不是對映，不同的對映可以有相同的核函式。對於給定的核函式，其對映方式不唯一，我們只知道對映到了高維空間，但是具體對映無法得知。

對映與核函式舉例：

$linearSVM$

$linearSVM$

$linearSVM$

$linearSVM$

f1與f2這兩個從二維到不同維度的對映，有相同的核函式.

常用的核函式：

定義在歐式空間中: 多項式核函式、高斯核函式、

歐式空間核離散資料都可以用: 字串核函式（常用於文字資訊分類)

2. 實現：

我的實現

訓練過程為SMO演算法:

https://github.com/autoliuweijie/MachineLearning/tree/master/SVM

scikit-learn:

簡單例子：

>>> from sklearn import svm
>>> X = [[0, 0], [1, 1]]
>>> y = [0, 1]
>>> clf = svm.SVC()
>>> clf.fit(X, y)  
SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
    decision_function_shape=None, degree=3, gamma='auto', kernel='rbf',
    max_iter=-1, probability=False, random_state=None, shrinking=True,
    tol=0.001, verbose=False)
>>> clf.predict([[2., 2.]])
array([1])

在建立svm.SVC物件時常用的可選引數如下：

C：為懲罰係數，預設為1.0
kernel：為核函式，可選值為‘linear’， ‘polynomial’，‘rbf’，‘sigmoid’。也可以自定義核函式，具體參考官方手冊。
class_weight：當出現unbalance問題時，這個引數可以用來設定類的權重。
decision_function_shape='ovo'：當進行多分類的時候，選擇多分類的策略，'ovo'表示'one against one', 'ovr'表示'one against rest'
更多引數請看官方指南：http://scikit-learn.org/stable/modules/svm.html#svm

如果想檢視支援向量是哪些：

>>> # get support vectors
>>> clf.support_vectors_
array([[ 0.,  0.],
       [ 1.,  1.]])
>>> # get indices of support vectors
>>> clf.support_ 
array([0, 1]...)
>>> # get number of support vectors for each class
>>> clf.n_support_ 
array([1, 1]...)

SVM還可以用與迴歸：

>>> from sklearn import svm
>>> X = [[0, 0], [2, 2]]
>>> y = [0.5, 2.5]
>>> clf = svm.SVR()
>>> clf.fit(X, y) 
SVR(C=1.0, cache_size=200, coef0=0.0, degree=3, epsilon=0.1, gamma='auto',
    kernel='rbf', max_iter=-1, shrinking=True, tol=0.001, verbose=False)
>>> clf.predict([[1, 1]])
array([ 1.5])

參考：

[1]《統計學習方法》 李航 2012年3月第一版
[2]《機器學習實戰》 Peter Harrington

機器學習：支援向量機SVM和人工神經網路ANN的比較

在統計學習理論中發展起來的支援向量機（Support Vector Machines, SVM）方法是一種新的通用學習方法，表現出理論和實踐上的優勢。SVM在非線性分類、函式逼近、模式識別等應用中有非常好的推廣能力，擺脫了長期以來形成的從生物仿生學的角度構建學習機器的束縛。

機器學習：支援向量機(SVM)

1. 理論概述：利用訓練集在特徵空間中求出一個分類超平面(w,b)把樣本切割開，依靠該超平面對新樣本進行分類。如果訓練集在當前的特徵空間中無法分割，則用核技術的對映函式把原特徵空間對映到高緯或

[四]機器學習之支援向量機SVM

4.1 實驗資料本資料集來源於UCI的Adult資料集，並對其進行處理得到的。資料集下載地址：http://archive.ics.uci.edu/ml/datasets/Adult。本實驗使用LIBSVM包對該資料進行分類。原始資料集每條資料有14個特徵，分別為age,workc

機器學習演算法——支援向量機svm，實現過程

初學使用python語言來實現支援向量機演算法對資料進行處理的全過程。 from sklearn.datasets import load_iris #匯入資料集模組 from sklearn.model_selection import train_test_spli

機器學習之支援向量機SVM Support Vector Machine (五) scikit-learn演算法庫

一、scikit-learn SVM演算法庫概述 scikit-learn中SVM的演算法庫分為兩類，一類是分類演算法庫，包括SVC、 NuSVC和LinearSVC三個類。另一類是迴歸演算法庫，包括SVR、NuSVR和LinearSVR三個類。相關的

機器學習模型-支援向量機(SVM)

Machine Learning - SVC 一.基本原理二.程式碼實現 import numpy as np from sklearn import datasets from sklearn.model_selection import train_test_spli

吳恩達機器學習：支援向量機

這次的課程筆記和上次隔了好久，因為為了搞懂 SVM 花了不少時間。和之前神經網路課程一樣，Ng 在 Coursera 上講述的內容非常有限，要搞懂 SVM 你只能尋求於其他方面的資料。經過對網上一些內容的對比後發現斯坦福的 CS229 講義寫得非常清晰。CS

機器學習之支援向量機SVM及程式碼示例

一、線性可分SVM SVM演算法最初是用來處理二分類問題的，是一種有監督學習的分類演算法。對於線性可分的二分類問題，我們可以找到無窮多個超平面，將兩類樣本進行區分。(超平面：一維中是一個點；二維中是一條線；三維中是一個面……) 在上面的多個超平面中，

【機器學習】支援向量機SVM原理及推導

參考：http://blog.csdn.net/ajianyingxiaoqinghan/article/details/72897399 部分圖片來自於上面部落格。 0 由來在二分類問題中，我們可以計算資料代入模型後得到的結果，如果這個結果有明顯的區別，

【機器學習】支援向量機SVM及例項應用

【機器學習】支援向量機1.分類超平面與最大間隔2.對偶問題與拉格朗日乘子法3.核函式4.軟間隔與正則化準備：資料集匯入SVM模組步驟：1.讀取資料集 2.劃分訓練樣本與測試樣本 3.訓練SVM

機器學習之支援向量機SVM Support Vector Machine (六) 高斯核調參

在支援向量機（以下簡稱SVM）的核函式中，高斯核（以下簡稱RBF）是最常用的，理論上 RBF一定不比線性核函式差，但是在實際應用中，卻面臨幾個重要超引數的調優問題。如果調的不好，可能比線性核函式還要差。所以實際應用中，能用線性核函式得到較好效果的都會選擇

Spark機器學習系列之13：支援向量機SVM

C−SVM基本公式推導過程下面摘抄一小部分內容（不考慮推導細節的話，基本上能理解C-SVM方法推導的整個流程）. 我們用一個超平面劃分圖中對圖中的兩類資料進行分類，超平面寫成f(x)=wTx+b=0,線上性可分的情況下，我們能找到一

機器學習之支援向量機： Support Vector Machines (SVM)

機器學習之支援向量機： Support Vector Machines (SVM) 歡迎訪問人工智慧研究網課程中心理解支援向量機（Understanding SVM）使用支援向量機（Using SVM）使用高斯核(Gaussian Kern

機器學習---演算法---支援向量機---線性SVM--第一部分

轉自：https://cuijiahua.com/blog/2017/11/ml_8_svm_1.html 什麼是SVM？ SVM的英文全稱是Support Vector Machines，我們叫它支援向量機。支援向量機是我們用於分類的一種演算法。讓我們以一個小故事的形式，開啟我們的SVM之旅吧。在很

機器學習筆記——支援向量機（SVM）

支援向量機除了之前講的機器學習的方法，還有一種常用的方法叫做支援向量機。我們將logistic迴歸的假設函式以及代價函式稍加更改就可以得到支援向量機的模型另外還有不同的是SVM的輸出並不是一個概率值，而是0或1 大間隔我們說SVM是一種大間隔演算法，意思是我們

機器學習之支援向量機（四）

引言：　　SVM是一種常見的分類器，在很長一段時間起到了統治地位。而目前來講SVM依然是一種非常好用的分類器，在處理少量資料的時候有非常出色的表現。SVM是一個非常常見的分類器，在真正瞭解他的原理之前我們多多少少都有接觸過他。本文將會詳細的介紹SVM的原理、目標以及計算過程和演算法步驟。我們針對線性可分資

機器學習筆記——支援向量機

一，線性可分支援向量機與硬間隔最大化 1.1 間隔與支援向量在樣本空間中，劃分超平面可通過如下線性方程來描述：其中，w = (w1;w2;...;wd)為法向量，決定了超平面的方向；b為位移項，決定了超平面與原點之間的距離。我們將超平面記為(w,b).樣本空間中任意點x到

機器學習5---支援向量機

1. 線性可分的支援向量機 1.1 支援向量機（SVM）基本型對於給定的在樣本空間中線性可分的訓練集，我們有多重辦法對其進行劃分，以二分類問題為例，如圖：紅線和黑線（超平面）都能將兩類樣本很好的劃分開，但是當新樣本進入時，黑線比紅線更加有可能正確劃分新的樣本，換句話說：越位

機器學習 --- 線性支援向量機

支援向量機是一種二分類模型，目的是尋找一個超平面對樣本進行劃分，其基本模型定義為特徵空間上的間隔最大的線性分類器。一、線性支援向量機的直觀理解給定訓練樣本集，，模型旨在能基於訓練集在樣本空間中找到一個合適的劃分超平面。在下圖

吳恩達機器學習13--支援向量機(Support Vector Machines)

第13章支援向量機(Support Vector Machines) 一，優化目標(Optimization objective) SVM也是廣泛的應用於工業界和學術界的監督學習演算法。類似於logistic的代價函式，SVM的代價函式如圖是斜直線加上平直線

機器學習：支援向量機(SVM)

1. 理論

2. 實現：

參考：

相關推薦