1. 程式人生 > >SVM---通俗易懂圖解高斯核函式

SVM---通俗易懂圖解高斯核函式

引言:

對於SVM的核函式,許多初學者可能在一開始都不明白核函式到底是怎麼做到從二維空間對映到三維空間(這裡我們特徵空間以二維為例),因此本文主要講解其中一種核函式——-高斯核函式作為介紹,另外感謝Andrew Ng在網易雲課堂深入淺出的講解,不但加深了我的理解,也為我寫這篇部落格提供了不少素材。

代價函式:
相比於Logistic Regression的代價函式:

min1m[i=1my(i)(loghθ(x(i)))+(1y(i))((lo
g(1hθ(x(i))))]
+λ2mj=1nθj2

SVM的代價函式只是稍微進行修改:

minC[i=1my(i)cost1(θTx(i))))+ (1y(i))cost0(θTx(i))+12j=1nθj2

其中hθ(x(i))=11+eθTx其實也就是sigmod函式。
而cost函式可以由下圖中的粉線表示:

這裡寫圖片描述

當然其中的轉折點是人為定義的,這裡選擇以1為轉折點。
此外,我們還能發現,相比於Logistic regression,SVM的優化函式只不是過
1λ
換成了C和修改了cost函式,其實差別並不大。當然,我們也能從老師PPT的圖中可以看出sigmod函式的大致走向。
當然啦,如果你看不懂這個也沒關係,這與下面的高斯核函式的理解上聯絡並不緊密。

為了引出核函式的作用,我們先來觀察決策邊界為非線性的情況:

這裡寫圖片描述

並且我們假設認為
θTx(i)>=1y=1為圖中紅色X
否則,y=0為圖中的藍色O

要想擬合這個非線性的決策邊界,其中有一種方法就是用高階函式去擬合這個特徵,事實上,這個方案是並不可行,因為這樣做存在一定的問題:從理論上來說,我們有很多不同的特徵去選擇來擬合這個邊界(選擇起來是一個問題)或者可能會存在比這些高階多項式更好的特徵,因為我們並不知道這些高階多項式的組合是否一定對模型的提升有幫助

引入高斯核函式:
首先我們先來看一下三維正態分佈的影象

這裡寫圖片描述

從影象中我們可以看出,離中心點越近,函式值就越接近於1。
其公式為:

y=e((x1μ)2+(x2μ)22σ2)

由指數函式的特徵,我們可以看到,如果指數部分為接近0,那麼y就會接近1;如果指數部分越小,那麼y就會越接近於0。
講到這裡,是否有點熟悉的感覺?沒錯,之前我在講標籤判定的時候,說到θTx(i)決定著最後類別的確定,那麼試想一下,如果我們把2維平面上的點,對映到到上圖中,那麼從上往下看就會看到類似於下面這張同心圓的圖:

這裡寫圖片描述

因此以任意一種顏色的同心圓作為決策邊界,我們都可以完成對資料集的簡單非線性劃分。那麼問題來了,如何對映到高維空間上去呢?