Spark機器學習系列之13: 支援向量機SVM
阿新 • • 發佈:2019-01-12
C−SVM 基本公式推導過程
下面摘抄一小部分內容(不考慮推導細節的話,基本上能理解C-SVM方法推導的整個流程).
我們用一個超平面劃分圖中對圖中的兩類資料進行分類,超平面寫成
如何理解這一點呢?如果我們找到一個 f(xi)|=|wTxi+b|=1
對一個數據點進行分類,當超平面離資料點的“間隔”越大,分類的確信度(confidence)也越大。所以,為了使得分類的確信度儘量高,需要讓所選擇的超平面能夠最大化這個“間隔”值。這個間隔如下圖中的
從解析幾何的角度可以證明
由於支援向量滿足
定義函式
需要求解的目標函式及約束條件為:
等價於下面的凸二次規劃問題:
拉格朗日函式為: