Spark機器學習系列之13：支援向量機SVM

阿新 • • 發佈：2019-01-12

C−SVM基本公式推導過程

下面摘抄一小部分內容（不考慮推導細節的話，基本上能理解C-SVM方法推導的整個流程）.

這裡寫圖片描述
我們用一個超平面劃分圖中對圖中的兩類資料進行分類，超平面寫成f(x)=wTx+b=0,線上性可分的情況下，我們能找到一些支援向量，滿足|wTx+b|=1。

如何理解這一點呢？如果我們找到一個（w，b）來表達超平面f(x)=wTx+b=0,那麼通過縮放，相當於找到了無數個（λ∗w，λ∗b）,λ不等於0即可，都可以等價的來表達這個超平面，比如說f(x)=3x1+4x2−2x3+6=0和f(x)=1.5x1+2x2−x3+3=0表示一模一樣的超平面，也就是說我們通過縮放(w,b)，總能使得裡超平面兩側最近的距離相等的這些支援向量(support vectors)滿足|

f(xi)|=|wTxi+b|=1，以達到簡化問題的目的。

對一個數據點進行分類，當超平面離資料點的“間隔”越大，分類的確信度（confidence）也越大。所以，為了使得分類的確信度儘量高，需要讓所選擇的超平面能夠最大化這個“間隔”值。這個間隔如下圖中的Gap2所示。
這裡寫圖片描述

從解析幾何的角度可以證明xi點離超平面方程wTx+b=0的距離為：

γ=|wTxi+b|||w||=|f(xi)|||w||
由於支援向量滿足|wTxi+b|=1,因此Gap2=1||w||
定義函式
yi=1當f(x)>0,
yi=−1當f(x)<0,

需要求解的目標函式及約束條件為：

max1|

|w||s.t.yi(wTxi+b)≥1i=1,2...n
等價於下面的凸二次規劃問題：
min12||w||2s.t.yi(wTxi+b)≥1i=1,2...n

拉格朗日函式為：

L(w,b,α)=12||w||2−∑i=1nαi(yi(wTxi+b)−1)

Spark機器學習系列之13：支援向量機SVM

C−SVM基本公式推導過程

Spark機器學習系列之13：支援向量機SVM

公開課機器學習筆記（13）支援向量機三核函式

機器學習二十二：支援向量機迴歸SVR

機器學習實戰（五）支援向量機SVM（Support Vector Machine）

Spark2.0機器學習系列之3：決策樹及Spark 2.0-MLlib、Scikit程式碼分析

Spark2.0機器學習系列之7： MLPC（多層神經網絡）

機器學習之旅：支援向量機通俗導論（理解SVM的三層境界）

Spark2.0機器學習系列之11：聚類(冪迭代聚類， power iteration clustering， PIC)

Spark2.0機器學習系列之10：聚類(高斯混合模型 GMM）

Spark2.0機器學習系列之2：Logistic迴歸及Binary分類（二分問題）結果評估

Spark2.0機器學習系列之1：基於Pipeline、交叉驗證、ParamMap的模型選擇和超引數調優

機器學習：支援向量機SVM和人工神經網路ANN的比較

機器學習：支援向量機(SVM)

機器學習演算法之七：5分鐘上手SVM

《SVM筆記系列之六》支援向量機中的核技巧那些事兒

機器學習筆記（參考吳恩達機器學習視訊筆記）11_支援向量機

機器學習 scikit-learn3 模型實踐 - 支援向量機和決策樹

機器學習入門（十）支援向量機

【機器學習基礎】軟間隔支援向量機

機器學習實戰（六）——支援向量機

Spark機器學習系列之13： 支援向量機SVM

C−SVM基本公式推導過程

相關推薦

Spark機器學習系列之13：支援向量機SVM