SVM支援向量機分類模型SVC理論+python sklean.svm實踐

支援向量機是啥

有一次公司專案上的同事一起吃飯（面前是一鍋炒土雞），提到了支援向量機，學文的同事就問支援向量機是什麼，另一個數學物理大牛想了一下，然後說，一種雞。。。

確實很難一句話解釋清楚這隻雞。。。support vector machine從字面意思來說應該是依靠support vector來劃分資料（其實也能迴歸啦。。）的機器學習模型。它是一個凸優化問題。

SVM的核心將資料的特徵投射到高維，然後找到超平面，分割不同類別的資料點，而且要使分離的程度越大越好，至於為什麼叫支援向量機，是因為每個類別都會有一些資料點作為支撐向量，這些支撐向量決定了最後分割的超平面。
@線性可分示意圖|300x200

這個圖裡的圈圈就是兩邊的支撐向量。

線性可分支援向量機

我們先講最簡單的情況，也就是線性可分的平面二分類問題。
支援向量機的目標是，找到一條分界線，把兩類資料分開。但是這樣的線可能有很多。
@多條線分割 | 200x100

像上圖。並不是每條線都是一個很好的分割線，如果緊貼著紅點，那麼線的另一頭會立馬被判為藍色，這樣對紅點就很不合適了。所以SVM的目標不光是要找到這樣一條分割線，而是要找到一條能最公平合理的分割線，讓兩類資料中最邊緣的資料點距離分割線越遠越好，這樣這個分類器的泛化能力才會更強。於是乎支撐向量就被引入了。

分割線，分類表示式

這裡寫圖片描述

直線的一般表示式：ax+by+c=0
對於多維，可以直接表達成：wTx+b=0，在多維情況下，它是個超平面。
對於直線上方的類別有w

Tx+b>0
對於直線下方的類別有wTx+b<0

距離表示式

有了直線，我們需要定義資料點到分割平面的距離，這裡用的是點到直線的距離公式。

distance=|Ax0+By0+C|A2+B2√
- 如果我們去掉絕對值，就可以根據大於零還是小於零來判斷資料點在直線上方還是下方。
- 更進一步，我們可以把它表示成如下形式：
distance=wTx0+b||w||

最大分割距離max margin

然後我們再來看一開始的那張圖：
這裡寫圖片描述

回顧一下支援向量機是要幹啥來著，是要找到一條把兩類資料分得很開的割平面對不對，這需要我們找到兩類資料最邊緣的資料點（支撐向量），然後畫出來兩條平行的切面，兩邊支撐向量距離的垂直平分線就是最終的切割平面。

支援向量機的目標是讓最邊緣的點之間的距離越大越好。即ρ最大

這是我們的終極目標，敲黑板！

目標函式表示式推導

接下來，我們來分析怎麼把這個目標寫成數學表示式~
很簡單，只需要表示support vector到分割線的距離，並且讓該距離最大不就行了。

ρ=2r=2|wTxsupport+b|||w||=2ysupport(wTxsupport+b)||w||
最右邊的等式成立是因為，y的sign和（直線上方的點記為1，直線下方的點記為-1）括號裡的一直，保證了分子大於零。

直線上方的點 yi=1wTxi+b≥ρ2

直線下方的點 yi=−1wTxi+b≤−ρ2

等價於：yi(wTxi+b)≥ρ2

那麼新的問題來了，我們如何知道哪個點是support vector?
答案就是離分割線最近的點對不對。
所以，目標函式是一個極小極大問題。。。

argmaxw,b{2||w||miniyi(wTxi+b)}.

之前我們有 yi(wTxi+b)≥ρ2，我們總可以通過縮放w和b，使該不等式右邊劃歸到1。如此，就可以簡化目標函式。

argmaxw,b2||w||s.t.yi(wTxi+b)≥1fori=1,2,3.....n

優化問題求解

我們把問題改為求它的對偶問題

argminw,b||w||22s.t.yi(wTx

SVM支援向量機分類模型SVC理論+python sklean.svm實踐

支援向量機是啥

線性可分支援向量機

分割線，分類表示式

距離表示式

最大分割距離max margin

目標函式表示式推導

優化問題求解

SVM支援向量機分類模型SVC理論+python sklean.svm實踐

SVM支援向量機系列理論（七）線性支援向量機與L2正則化 Platt模型

SVM支援向量機系列理論（六） SVM過擬合的原因和SVM模型選擇

SVM支援向量機系列理論（二）線性可分SVM模型的對偶問題

SVM支援向量機系列理論（九）核嶺迴歸

SVM支援向量機系列理論(八) 核邏輯迴歸

SVM支援向量機系列理論（四）軟間隔支援向量機

SVM支援向量機系列理論（五）SVM中幾種核函式的對比

SVM支援向量機系列理論（三）非線性支援向量機與核函式技巧

SVM支援向量機原理(二) 線性支援向量機的軟間隔最大化模型

斯坦福CS229機器學習筆記-Lecture6-多元伯努利事件模型+SVM支援向量機

[機器學習]svm支援向量機介紹

【SVM-tutorial】SVM-支援向量機綜述

【IM】關於支援向量機分類的理解

機器學習實戰——SVM支援向量機實現記錄

SVM(支援向量機)

機器學習（十一） SVM-支援向量機

機器學習演算法——SVM(支援向量機)

05 SVM - 支援向量機 - 概念、線性可分

機器學習7：SVM(支援向量機)

SVM支援向量機分類模型SVC理論+python sklean.svm實踐

支援向量機是啥

線性可分支援向量機

分割線，分類表示式

距離表示式

最大分割距離max margin

目標函式表示式推導

優化問題求解

相關推薦