1. 程式人生 > >機器學習筆記(八)-吳恩達視訊課程(支援向量機SVM)

機器學習筆記(八)-吳恩達視訊課程(支援向量機SVM)

1.支援向量機的優化目標

以下是新建的 SVM 的影象,左邊為y=1時,右邊為y=0時

然後進行轉換

2.SVM 被看做大邊界分類器(大間距)的情況

在y=1時,\theta ^{T}X  >= 1   代價函式為0

在y=0時,\theta ^{T}X  <=-1   代價函式為0

注意不是與0作比較來判定,這樣就有了安全間距

 

可以看到圖中黑色,粉色,綠色三個邊界,

黑色邊界是最穩健的邊界,它和樣本之間有更大的距離,叫做間距

如果將C設定的非常大或者特別小,就會得到黑色以外的其型別的分類的線,

但是如果將C設定的不是特別大並且也不是特別小時(C應該足夠大,只是不可以特別大),就會得到黑色的線,他可以忽略掉一些異常點

的影響,得到更好地決策界

無論怎樣,最終的優化結果都是要讓在y=1和y=0兩種情況下都使得代價函式左邊一項儘量為0,這時最小化問題就轉化為了:

3.核函式

獲取新的特徵,可以通過對原有的特徵進行組合(如),利用新特徵f來替換模型中的每一項,如f_{1}=x_{1},f_{2}=x_{2},f_{3}=x_{1}x_{2},f_{4}=x_{1}^{2},,這樣就得到了,除了這樣,還可以利用核函式來計算出新的特徵。

由上面公式可以得知,當一個訓練例項x與地標L的距離近似於0的時候,新特徵f 進近似於 e^{-0}=1;

如果個訓練例項x與地標L的距離近很遠的時候,新特徵f 進近似於 e^{-\infty }=0。

 

橫縱座標為x1,x2,只有當x與L重合的時候(距離為0)f才有最大值

1,隨著x的改變,f值改變的速率受到\large \delta^{2}的控制(如上圖)。

選擇地標

也就是每個樣本\large x^{(i)}對應著都m個特徵

下圖中的example x ( 樣本x) 可以是訓練集,測試集,交叉驗證集中任何一個

(也就是為了提高計算效率)