機器學習之深入理解SVM

在瀏覽本篇部落格之前，最好先檢視一下我寫的另一篇文章機器學習之初識SVM（點選可查閱哦），這樣可以更好地為了結以下內容做鋪墊！

支援向量機學習方法包括構建由簡至繁的模型：線性可分支援向量機、線性支援向量機及非線性支援向量機。當訓練資料線性可分時，通過硬間隔最大化，學習一個線性的分類器，即線性可分支援向量機，又稱為硬間隔支援向量機；當訓練資料近似線性可分時，通過軟間隔最大化，也學習一個線性的分類器，即線性支援向量機，又稱為軟間隔支援向量機；當訓練資料線性不可分時，通過使用核技巧及軟間隔最大化，學習非線性支援向量機。

給定訓練樣本集D=(x1,y1),(x2,y2),.....

.(xm,ym),y∈−1,+1，分類學習最基本的想法就是基於訓練集D在樣本空間中找到一個超平面，將不同類別的樣本分開。但是正如下圖所示，能將訓練樣本分開的超平面可能有很多，那我們應該選擇哪一個呢？

直觀上看，我們應該去找位於兩類訓練樣本“正中間”的超平面，也就是樣本點與直線的距離最大那條直線。因為該超平面對訓練樣本區域性擾動的容忍性最好。

在樣本空間中，超平面可用如下方程來描述：

wTx+b=0,

其中w=(w1,w2,...wd)為法向量，決定了超平面的方向；b為位移項，是超平面與遠點之間的距離。顯然超平面可由法向量w和位移b唯一確定。

一般來說，一個點距離超平面的距離d的大小可以表示分類預測的確信程度。在超平面w

Tx+b=0確定的情況下，

d=|wTx+b|||w||（１）

其中，||w||為w的範數。

當點A表示某一例項xi，其類標記為yi=+1。點A與超平面的距離記作di，那麼

di=wTxi+b||w||（２）

當點A表示某一例項xi，其類標記為yi=−1。點A與超平面的距離記作di，那麼

di=−wTxi+b||w||（３）

一般地，點xi與超平面的距離是

di=yiwTxi+b||w||（４）

公式（４）也被稱為超平面關於樣本點xi的幾何間隔。

最大間隔分離超平面

如上圖所示，距離超平面最近的這幾個訓練樣本點被稱為支援向量，兩個異類支援向量（即分別位於超平面兩側的點）到超平面的距離之和為

d=2||w||（５）
上面（5）的d稱為間隔（margin）。

要求得最大間隔（即最大化2w），就是要滿足：

顯然，為了最大化間隔，僅需最大化||w||−1，這等價於最小化||w||2，於是上式可以重寫為：

這就是支援向量機的基本模型。

因為現在的目標函式是二次的，約束條件是線性的，所以它是一個凸二次規劃問題。這個問題可以用現成的QP (Quadratic Programming) 優化包進行求解。一言以蔽之：在一定的約束條件下，目標最優，損失最小。

此外，由於這個問題的特殊結構，還可以通過拉格朗日對偶性（Lagrange Duality）變換到對偶變數 (dual variable) 的優化問題，即通過求解與原問題等價的對偶問題（dual problem）得到原始問題的最優解，這就是線性可分條件下支援向量機的對偶演算法，這樣做的優點在於：一者對偶問題往往更容易求解；二者可以自然的引入核函式，進而推廣到非線性分類問題。

那什麼是拉格朗日對偶性呢？簡單來講，通過給每一個約束條件加上一個拉格朗日乘子（Lagrange multiplier），定義拉格朗日函式（通過拉格朗日函式將約束條件融合到目標函式裡去，從而只用一個函式表示式便能清楚的表達出我們的問題）：

然後令

容易驗證，當某個約束條件不滿足時，例如yi(wTxi+b)<1，那麼顯然有θ(w)=∞（只要令αi=∞即可）。而當所有約束條件都滿足時，則最優值為θ(w)=12||w||2，亦即最初要最小化的量。

因此，在要求約束條件得到滿足的情況下最小化

機器學習之深入理解SVM

機器學習之深入理解SVM

機器學習之深入理解神經網路理論基礎、BP演算法及其Python實現

機器學習之用Hog+Svm人臉檢測、交通標誌和字元識別等(初學者)

C++學習之深入理解虛擬函式--虛擬函式表解析

機器學習：深入理解 LSTM 網路 (一)

整理OD學習之深入理解訊息迴圈

機器學習之旅：支援向量機通俗導論（理解SVM的三層境界）

機器學習之 SVM VC維度、樣本數目與經驗風險最小化的關系

機器學習之SVM初解與淺析（一）:最大距離

機器學習之SVM初解與淺析（一）:

機器學習之支持向量機（三）：核函數和KKT條件的理解

機器學習之SVM

菜鳥之路——機器學習之HierarchicalClustering層次分析及個人理解

[四]機器學習之支援向量機SVM

深入瞭解機器學習之降低損失：迭代方法

深入瞭解機器學習之降低損失 (Reducing Loss)：梯度下降法

讀書筆記之深入理解Java虛擬機器

機器學習之SVM詳解

深入瞭解機器學習之降低損失 (Reducing Loss)：學習速率

深入瞭解機器學習之使用 TensorFlow 的起始步驟 (First Steps with TensorFlow)：工具包

機器學習之深入理解SVM

相關推薦