機器學習筆記(八)-吳恩達視訊課程(支援向量機SVM)
阿新 • • 發佈:2018-12-21
1.支援向量機的優化目標
以下是新建的 SVM 的影象,左邊為y=1時,右邊為y=0時
然後進行轉換
2.SVM 被看做大邊界分類器(大間距)的情況
在y=1時, >= 1 代價函式為0
在y=0時, <=-1 代價函式為0
注意不是與0作比較來判定,這樣就有了安全間距
可以看到圖中黑色,粉色,綠色三個邊界,
黑色邊界是最穩健的邊界,它和樣本之間有更大的距離,叫做間距
如果將C設定的非常大或者特別小,就會得到黑色以外的其型別的分類的線,
但是如果將C設定的不是特別大並且也不是特別小時(C應該足夠大,只是不可以特別大),就會得到黑色的線,他可以忽略掉一些異常點 的影響,得到更好地決策界。
無論怎樣,最終的優化結果都是要讓在y=1和y=0兩種情況下都使得代價函式左邊一項儘量為0,這時最小化問題就轉化為了:
3.核函式
獲取新的特徵,可以通過對原有的特徵進行組合(如),利用新特徵f來替換模型中的每一項,如,這樣就得到了,除了這樣,還可以利用核函式來計算出新的特徵。
由上面公式可以得知,當一個訓練例項x與地標L的距離近似於0的時候,新特徵近似於 =1;
如果個訓練例項x與地標L的距離近很遠的時候,新特徵近似於 =0。
橫縱座標為x1,x2,只有當x與L重合的時候(距離為0)才有最大值
選擇地標
也就是每個樣本對應著都m個特徵
下圖中的example x ( 樣本x) 可以是訓練集,測試集,交叉驗證集中任何一個
(也就是為了提高計算效率)