SVM（支援向量機）- 基本思想（一）

阿新 • • 發佈：2019-01-01

SVM（支援向量機）- 基本思想(一)

Reference:

《convex optimization》SP Boyd, L Vandenberghe – 2004

說明：本系列純粹是pluskid部落格的狗尾續貂之作，寫下了只是想讓自己踏踏實實學點東西，如果看懂了pluskid的部落格，那就直接Pass,如果有不清楚的地方，說不定我的部落格裡面會給你一些啟發。

1 Basic idear

Figure 1

Question :

假設樣本為二維的情況，圖中有紅藍兩種點，代表已經有的兩類樣本資料，我們需要在紅、藍之間找一個分介面，使得分介面的一邊是一類，另一邊是另一類。很明顯，會有很多個滿足條件的平面，比如圖中的紫色和深紅色的兩條直線，我們要找的是一個最優的超平面，使得對後續要分類的測試點，也能取得比較準確的分類，即泛化能力要強。例如，現在我們要對黑色和黃色兩個測試點進行分類，我們僅有的資訊就是藍方和紅方的分佈，觀察這兩方的分佈，直觀上我們認為，黑色該屬於藍方，而棕色該屬於紅方。然而，紫色直線把黑色測試點分類為紅方，黃色點分為藍方，因此，相對深紅色直線泛化能力略微遜色了點。那怎樣的一條直線才是泛化能力最好的呢？這就是技術活了，直觀上我們覺得紫色直線靠，兩點太近了將紫色直線順時針旋轉一點點會效果更好，比如轉到紅色直線的位置。那紅色直線具有什麼樣的屬性呢？一般這種問題都會轉化成為一個最優化問題，讓數學來回答這個問題，SVM也不例外。

Answer :

既然很多直線都能滿足，那我們就找這裡面最特殊的一條，特殊在於距離。在能正確區分訓練集的直線集中，計算它門到最近樣本點的距離，我們選擇使得此距離最大的那條直線。

Formulation:

（1）點到直線的距離：

Figure 2

直線方程為，求點到該直線的距離

取直線上任意一點，則將向量往法向量投影得到

同時滿足代入上式得

但是求出來的距離在直線下方為負，在直線上方為正，而我們一般的類別標號就是取因此，就都統一為正的了。不過實際上每類樣本取正還是負都沒關係。假設為直線上方的樣本點標號為時的解，現在將其變為負，即

取為

，要滿足

，顯然此時的解

。即法向量

變換方向，

也取反。

直接決定了分界直線相對原點的偏移。易得原點到分界直線的距離

。

（2）滿足條件的直線中使得距離最近的點到直線的距離最大

是要找到樣本點到特定直線的最近距離，是要找到使得最近距離最大的直線。

Opotimizing function

優化(1.3)即得到我們要求的最優分界直線。但是直接優化(1.3)很困難，因為變化，對應的也可能會變化，使得優化過程中要在之間不斷切換，弄得我們手忙腳亂。對於這種好動的函式，我們要像醫生一樣，給它綁起來（回憶下金剛狼的場景）。

注意到對任意，都可以通過對等比例縮放使得其為（固定），同時還能保證

（等價）。那麼優化(1.3)可簡化成優化：

當然前提是我們能將最近的距離調節為1，於是加上約束條件（感覺像手銬腳鏈……）：

優化之後總能使得兩類樣本都有點（向量）到分界線的函式距離：，如Figure 1中紅色和藍色穿直線穿過的點。正是在上的向量（即點）決定了分界線，因此它們被稱為支援向量，而SVM是一個分類器，可以理解成能自動判別的機器，所以合稱支援向量機。

首先說明下為什麼最終支援向量到分界線函式的距離是相等的，即。試想下，如果一邊距離遠，一邊距離近，考慮式(1.3)那麼就對距離近的支援向量取，很明顯，它的距離可以向距離遠的這邊移動來達到更大的值。因此，兩類樣本都不會讓步，最終只能本著公平公正的原則取中間。

為什麼一定是呢？試想下，如果，很明顯，將，那麼也將縮小為1，那麼式(1.4)將增大倍，因而不是最優值，因為就比它更優。因此，最終總能使得。

Further

這裡討論的是二維的情況，對於三維的樣本，可以拓展為分界平面，對於更高維的情況，可以拓展為分界超平面。

對於線性不可分的情況，即無論如何都找不到一條直線能夠完全區分出兩類樣本，即包容的點。允許它們犯點錯誤，使得。

當錯誤已經大到忍無可忍的時候，我們將對映到高維空間，從而擴充套件成非線性分界曲線/面。

2 Optimizatin solving 待續

SVM（支援向量機）- 基本思想（一）

SVM（支援向量機）- 基本思想(一) Reference: 《convex optimization》SP Boyd, L Vandenberghe – 2004 說明：本系列純粹是pluskid部落格的狗尾續貂之作，寫下了只是想讓自

svm（支援向量機）簡單版本

網上最好的講解版本，我覺得是這個https://blog.csdn.net/v_july_v/article/details/7624837 從推導到說明都很完整。基於此篇部落格和其他資料，我自己推導了簡單版本，沒有涉及最優化計算和證明，在此記錄，此後再有重要知識點還會補充到這篇中。

機器學習筆記（八）-吳恩達視訊課程（支援向量機SVM）

1.支援向量機的優化目標以下是新建的 SVM 的影象，左邊為y=1時，右邊為y=0時然後進行轉換 2.SVM 被看做大邊界分類器（大間距）的情況在y=1時， >= 1 代價函式為0 在y=0時， <=-

機器學習第三個演算法SVM上（支援向量機）

突然發現看彭亮老師視訊的人很多，而且看完寫部落格的人也很多，見到一個哥們基本上把彭良老師的視訊內容完整的搬抄到部落格上，程式碼什麼的也基本沒改動，這就可以讓我先看部落格再看視訊，最後自己寫部落格這樣一種思路來學習。然後看部落格的過程中發現了好多大神。那哥們部

SVM（支援向量機）原理

SVM原理 SVM主要就是找出一個能夠將某個值最大化的超平面，這個值就是超平面離所有訓練樣本的最小距離。這個超平面可以用f(x)來定義： f(x)=β0+βTx, β 叫做權重向量，β0叫做偏置(bias) 。（所以就是他的權重向量的轉置乘

sklearn的快速使用之八（支援向量機）

print(__doc__) import numpy as np import matplotlib.pyplot as plt from sklearn import svm, datasets def make_meshgrid(x, y, h=.02):

大資料入門——手寫體資料識別（支援向量機）

#手寫體資料讀取 from sklearn.datasets import load_digits digits=load_digits() print(digits.data.shape) #

周志華《機器學習》之第六章（支援向量機）概念總結

在之前就一直總是零零碎碎瞭解過這個熱及一時的統計學方法對樣本進行分類的支援向量機演算法。一直想系統的瞭解一下支援向量機這個很強的分類演算法，有幸在周老師的機器學習這本書中進行系統的學習。這裡我只列出一些需要重點理解的概念，以方便以後自己進行回顧，在部落格中也

基於支援向量機的影象分類（下篇：MATLAB實現）

摘要：本文通過圖文詳細介紹如何利用支援向量機對影象進行分類，經過上篇文章對原理的介紹，這裡介紹利用MATLAB程式設計實現。後續章節將介紹的主要部分有：圖片資料集整理特徵提取 SVM訓練與測試分類結果評價結果顯示 1. 前言機器學習是人工智慧

機器學習實戰-第六章（支援向量機）

1 拉格朗日乘子法(等式約束)：目標函式：f(x)=b+wTxi+∑(αihi),s.t.hi=0 最優解條件：∂h∂xi=0 2 kkt(不等式約束)：目標函式：f(x)=b+wTxi+∑(αigi)+∑(βihi),s.t.hi=0,gi≤0

分類演算法SVM（支援向量機)

支援向量機（Support Vector Machine ,SVM）的主要思想是：建立一個最優決策超平面，使得該平面兩側距離該平面最近的兩類樣本之間的距離最大化，從而對分類問題提供良好的泛化能力。對

基於支援向量機的影象分類（上篇）

摘要：本文通過圖文詳細介紹如何利用支援向量機對影象進行分類。這篇文章從什麼是影象分類任務開始一步步詳細介紹支援向量機原理，以及如何用它解決影象多分類任務。將這部分內容分為上下兩篇：上篇重點詳細介紹實現原

支援向量機SMO演算法實現（原始碼逐條解釋）

支援向量機號稱機器學習中最好的演算法——存在最優解，而且一般問題都可以得解。但是演算法需要的儲存空間和計算複雜度較大，不大適合大資料量的運算，不過經過platt發明的SMO簡化運算後，效率可以提高很多。以下是筆者用Matlab語言寫的支援向量機兩分類問題的原始碼，因為在網路

Dual SVM (對偶支援向量機)

1. SVM 目標函式及約束條件 SVM 的介紹及數學推導參考：我的CSDN，此處直接跳過，直接給出 SVM 的目標函式和約束條件： minw,b12wTws.t.yn(wTxn+b)≥1,n=1,..N 2. 拉格朗日乘子形式利用拉格朗日乘子

如何使用支援向量機（Support Vector Machine，SVM）思想解決迴歸問題

迴歸問題的本質其實就是找到一根直線也好曲線也好，能夠最佳程度擬合我們的資料點，在這裡，怎樣定義擬合其實就是迴歸演算法的關鍵。比如說我們之前學過的線性迴歸演算法定義擬合的方式，就是讓我們的資料點到我們預測的直線相應的MSE的值最小，而對於SVM演算法的思路來說，對擬

機器學習實戰（五）支援向量機SVM（Support Vector Machine）

目錄 0. 前言 1. 尋找最大間隔 2. 拉格朗日乘子法和KKT條件 3. 鬆弛變數 4. 帶鬆弛變數的拉格朗日乘子法和KKT條件 5. 序列最小優化SMO（Sequential Minimal Optimiz

吳恩達機器學習（第十三章）---支援向量機SVM

一、優化目標邏輯迴歸中的代價函式：畫出兩種情況下的函式影象可得： y=1: 我們找一條折線來近似表示這個函式影象 y=0：我們用這兩條折線來近似表示原來的曲線函式可得新的代價函式（假設-log(h(x))為,-log(1

4.支援向量機（SVM）演算法(下）

1.SVM演算法的特點 1.1 訓練好的模型的演算法複雜度是由支援向量的個數決定的，而不是由資料的維度決定的。所有SVM不太容易產生overfitting 1.2 SVM訓練出來的模型完全依賴於支援向量（Support Vectors），即使訓練集裡面所有非支援向量的點都

3.支援向量機（SVM）演算法(上）

SVM 1.基本概念支援向量機（Support Vector Machine, SVM）的基本模型是在特徵空間上找到最佳的分離超平面使得訓練集上正負樣本間隔最大。SVM是用來解決二分類問題的有監督學習演算法，在引入了核方法之後SVM也可以用來解決非線性問題。一般SVM有下面三

1. 支援向量機（SVM）原理

1. 前言在我沒有學習接觸機器學習之前，我就已經聽說了SVM這個機器學習的方法。SVM自它誕生以來就以優秀的分類效能牢牢佔據了霸主地位。 2. SVM原理支援向量機（Support Vector Machine, SVM）的基本模型是在特徵空間上找到最佳的分離超平面使得訓練集上正負樣本間隔最大。SV