1. 程式人生 > >核函式與徑向基函式 (Radial Basis Function 簡稱 RBF)詳解

核函式與徑向基函式 (Radial Basis Function 簡稱 RBF)詳解

轉載於 :http://blog.csdn.net/huang1024rui/article/details/51510611

1.核函式

1.1核函式的由來

-----------還記得為何要選用核函式麼?-----------

對於這個問題,在Jasper's Java Jacal部落格《SVM入門(七)為何需要核函式》中做了很詳細的闡述,另外博主對於SVM德入門學習也是做了很詳細的闡述,有興趣的可以去學習,寫得相當好,特意轉載了過來,留念一下。

如果提供的樣本線性不可分,結果很簡單,線性分類器的求解程式會無限迴圈,永遠也解不出來。這必然使得它的適用範圍大大縮小,而它的很多優點我們實在不原意放棄,怎麼辦呢?是否有某種方法,讓線性不可分的資料變得線性可分呢?

例子是下面這張圖:


我們把橫軸上端點a和b之間紅色部分裡的所有點定為正類,兩邊的黑色部分裡的點定為負類。試問能找到一個線性函式把兩類正確分開麼?不能,因為二維空間裡的線性函式就是指直線,顯然找不到符合條件的直線。

但我們可以找到一條曲線,例如下面這一條:


顯然通過點在這條曲線的上方還是下方就可以判斷點所屬的類別(你在橫軸上隨便找一點,算算這一點的函式值,會發現負類的點函式值一定比0大,而正類的一定比0小)。這條曲線就是我們熟知的二次曲線,它的函式表示式可以寫為:


問題只是它不是一個線性函式,但是,下面要注意看了,新建一個向量y和a:


這樣g(x)就可以轉化為f(y)=<a,y>,你可以把y和a分別迴帶一下,看看等不等於原來的g(x)。用內積的形式寫你可能看不太清楚,實際上f(y)的形式就是:

g(x)=f(y)=ay

在任意維度的空間中,這種形式的函式都是一個線性函式(只不過其中的a和y都是多維向量罷了),因為自變數y的次數不大於1。

看出妙在哪了麼?原來在二維空間中一個線性不可分的問題,對映到四維空間後,變成了線性可分的!因此這也形成了我們最初想解決線性不可分問題的基本思路——向高維空間轉化,使其變得線性可分。

而轉化最關鍵的部分就在於找到x到y的對映方法。遺憾的是,如何找到這個對映,沒有系統性的方法(也就是說,純靠猜和湊)。具體到我們的文字分類問題,文字被表示為上千維的向量,即使維數已經如此之高,也常常是線性不可分的,還要向更高的空間轉化。其中的難度可想而知。

小Tips:為什麼說f(y)=ay是四維空間裡的函式?

大家可能一時沒看明白。回想一下我們二維空間裡的函式定義
g(x)=ax+b
變數x是一維的,為什麼說它是二維空間裡的函式呢?因為還有一個變數我們沒寫出來,它的完整形式其實是
y=g(x)=ax+b

y=ax+b
看看,有幾個變數?兩個,二維。
再看看
f(y)=ay
裡面的y是三維的變數,再加上f(y)成為四維的了。


用一個具體文字分類的例子來看看這種向高維空間對映從而分類的方法如何運作,想象一下,我們文字分類問題的原始空間是1000維的(即每個要被分類的文件被表示為一個1000維的向量),在這個維度上問題是線性不可分的。現在我們有一個2000維空間裡的線性函式

f(x)=<w,x>+b

注意向量的右上角有個 ’哦。它能夠將原問題變得可分。式中的 w和x都是2000維的向量,只不過w是定值,而x是變數(好吧,嚴格說來這個函式是2001維的,哈哈),現在我們的輸入呢,是一個1000維的向量x,分類的過程是先把x變換為2000維的向量x,然後求這個變換後的向量x與向量w的內積,再把這個內積的值和b相加,就得到了結果,看結果大於閾值還是小於閾值就得到了分類結果。

你發現了什麼?我們其實只關心那個高維空間裡內積的值,那個值算出來了,分類結果就算出來了。而從理論上說, x是經由x變換來的,因此廣義上可以把它叫做x的函式(有一個x,就確定了一個x,對吧,確定不出第二個),而w是常量,它是一個低維空間裡的常量w經過變換得到的,所以給了一個w 和x的值,就有一個確定的f(x)值與其對應。這讓我們幻想,是否能有這樣一種函式K(w,x),他接受低維空間的輸入值,卻能算出高維空間的內積值<w,x>?

如果有這樣的函式,那麼當給了一個低維空間的輸入x以後,

g(x)=K(w,x)+b

f(x)=<w,x>+b

這兩個函式的計算結果就完全一樣,我們也就用不著費力找那個對映關係,直接拿低維的輸入往g(x)裡面代就可以了(再次提醒,這回的g(x)就不是線性函式啦,因為你不能保證K(w,x)這個表示式裡的x次數不高於1哦)。

萬幸的是,這樣的K(w,x)確實存在(發現凡是我們人類能解決的問題,大都是巧得不能再巧,特殊得不能再特殊的問題,總是恰好有些能投機取巧的地方才能解決,由此感到人類的渺小),它被稱作核函式(核,kernel),而且還不止一個,事實上,只要是滿足了Mercer條件的函式(後面會具體寫出),都可以作為核函式。核函式的基本作用就是接受兩個低維空間裡的向量,能夠計算出經過某個變換後在高維空間裡的向量內積值。幾個比較常用的核函式,俄,教課書裡都列過,我就不敲了(懶!)。

回想我們上節說的求一個線性分類器,它的形式應該是:


現在這個就是高維空間裡的線性函式(為了區別低維和高維空間裡的函式和向量,我改了函式的名字,並且給w和x都加上了 ’),我們就可以用一個低維空間裡的函式(再一次的,這個低維空間裡的函式就不再是線性的啦)來代替,


又發現什麼了?f(x’) 和g(x)裡的α,y,b全都是一樣一樣的!這就是說,儘管給的問題是線性不可分的,但是我們就硬當它是線性問題來求解,只不過求解過程中,凡是要求內積 的時候就用你選定的核函式來算。這樣求出來的α再和你選定的核函式一組合,就得到分類器啦!

明白了以上這些,會自然的問接下來兩個問題:

1. 既然有很多的核函式,針對具體問題該怎麼選擇?

2. 如果使用核函式向高維空間對映後,問題仍然是線性不可分的,那怎麼辦?

第一個問題現在就可以回答你:對核函式的選擇,現在還缺乏指導原則!各種實驗的觀察結果(不光是文字分類)的確表明,某些問題用某些核函式效果很 好,用另一些就很差,但是一般來講,徑向基核函式是不會出太大偏差的一種,首選。(我做文字分類系統的時候,使用徑向基核函式,沒有引數調優的情況下,絕 大部分類別的準確和召回都在85%以上,可見。雖然libSVM的作者林智仁認為文字分類用線性核函式效果更佳,待考證)

對第二個問題的解決則引出了我們下一節的主題:鬆弛變數。

==================

2.核函式的定義及計算複雜度

將核函式形式化定義,如果原始特徵內積是,對映後為,那麼定義核函式(Kernel)為:

到這裡,我們可以得出結論,我們計算SVM的分類問題的時候,只需先計算,然後計算即可,然而這種計算方式是非常低效的。比如最初的特徵是n維的,我們將其對映到n^2維,然後再計算,這樣需要的時間。那麼我們能不能想辦法減少計算時間呢? 
先看一個例子,假設x和z都是n維的,

展開後,得

這個時候發現我們可以只計算原始特徵x和z內積的平方(時間複雜度是O(n)),就等價與計算對映後特徵的內積。也就是說我們不需要花時間了。
由於計算的是內積,我們可以想到IR中的餘弦相似度,如果x和z向量夾角越小,那麼核函式值越大,反之,越小。 因此,核函式值是的相似度。

2.徑向基函式——Radial Basis Function(RBF)

所謂徑向基函式 (Radial Basis Function 簡稱 RBF), 就是某種沿徑向對稱的標量函式。 通常定義為空間中任一點x到某 一中心xc之間歐氏距離的單調函式 ,可記作 k(||x-xc||), 其作用往往是區域性的 , 即當x遠離xc時函式取值很小。

最常用的徑向基函式是高斯核函式 ,形式為 k(||x-xc||)=exp{- ||x-xc||^2/(2*σ)^2) } 其中x_c為核函式中心,σ為函式的寬度引數 , 控制了函式的徑向作用範圍。如果x和x_c很相近那麼核函式值為1,如果x和x_c相差很大那麼核函式值約等於0。由於這個函式類似於高斯分佈,因此稱為高斯核函式,也叫做徑向基函式(Radial Basis Function 簡稱RBF)。它能夠把原始特徵對映到無窮維。

那麼核函式值約等於0。由於這個函式類似於高斯分佈,因此稱為高斯核函式,也叫做徑向基函式(Radial Basis

Function 簡稱RBF)。它能夠把原始特徵對映到無窮維。

既然高斯核函式能夠比較x和z的相似度,並對映到0到1,回想logistic迴歸,sigmoid函式可以,因此還有sigmoid核

函式等等。

==================

核函式有很多種,如線性核、多項式核、Sigmoid 核和 RBF(Radial Basis function)核。本文選定 RBF 核為 SVM 的核函式(RBF 核K(x, y) = exp(-γ || x -y ||的平方),γ > 0)。因為RBF 核可以將樣本對映到一個更高維的空間,可以處理當類標籤(Class Labels)和特徵之間的關係是非線性時的樣例。Keerthi 等[25]證明了一個有懲罰引數C 的線性核同有引數(C,γ )(其中C 為懲罰因子,γ 為核引數)的 RBF 核具有相同的效能。對某些引數,Sigmoid核同 RBF 核具有相似的效能[26]。另外,RBF 核與多項式核相比具有引數少的優點。因為引數的個數直接影響到模型選擇的複雜性。非常重要的一點是0< Kij ≤1與多項式核相反,核值可能趨向無限(γxi xj + r >1)或者0 < γxi xj + r <1,跨度非常大。而且,必須注意的是Sigmoid 核在某些引數下是不正確的(例如,沒有兩個向量的內積)。

用交叉驗證找到最好的引數 C 和γ 。使用 RBF 核時,要考慮兩個引數 C 和γ 。因為引數的選擇並沒有一定的先驗知識,必須做某種型別的模型選擇(引數搜尋)。目的是確定好的(C,γ)使得分類器能正確的預測未知資料(即測試集數 據),有較高的分類精確率。值得注意的是得到高的訓練正確率即是分類器預測類標籤已知的訓練資料的正確率)不能保證在測試集上具有高的預測精度。因此,通 常採用交叉驗證方法提高預測精度。k 折交叉驗證(k-fold cross validation)

=========================

下面有張圖說明在低維線性不可分時,對映到高維後就可分了,使用高斯核函式。


來自Eric Xing的slides

注意,使用核函式後,怎麼分類新來的樣本呢?線性的時候我們使用SVM學習出w和b,新來樣本x的話,我們使用來判斷,如果值大於等於1,那麼是正類,小於等於是負類。在兩者之間,認為無法確定。如果使用了核函式後,就變成了,是否先要找到,然後再預測?答案肯定不是了,找很麻煩,回想我們之前說過的


只需將clip_image057[4]替換成,然後值的判斷同上。


建議首選RBF核函式進行高維投影,因為:

  1. 能夠實現非線性對映;( 線性核函式可以證明是他的一個特例;SIGMOID核函式在某些引數上近似RBF的功能。)
  2. 引數的數量影響模型的複雜程度,多項式核函式引數較多。
  3. the RBF kernel has less numerical difficulties.

3. 核函式有效性判定

問題:給定一個函式K,我們能否使用K來替代計算,也就說,是否能夠找出一個,使得對於所有的x和z,都有
比如給出了,是否能夠認為K是一個有效的核函式。
下面來解決這個問題,給定m個訓練樣本,每一個對應一個特徵向量。那麼,我們可以將任意兩個帶入K中,計算得到。i可以從1到m,j可以從1到m,這樣可以計算出m*m的核函式矩陣(Kernel Matrix)。為了方便,我們將核函式矩陣和都使用K來表示。

如果假設K是有效地核函式,那麼根據核函式定義

可見,矩陣K應該是個對稱陣。讓我們得出一個更強的結論,首先使用符號來表示對映函式的第k維屬性值。那麼對於任意向量z,得

最後一步和前面計算時類似。從這個公式我們可以看出,如果K是個有效的核函式(即等價),那麼,在訓練集上得到的核函式矩陣K應該是半正定的(K>=0).

這樣我們得到一個核函式的必要條件

K是有效的核函式 ==> 核函式矩陣K是對稱半正定的。

可幸的是,這個條件也是充分的,由Mercer定理來表達。 

Mercer定理:

如果函式K是上的對映(也就是從兩個n維向量對映到實數域)。那麼如果K是一個有效核函式(也稱為Mercer核函式),那麼當且僅當對於訓練樣例,其相應的核函式矩陣是對稱半正定的。


Mercer定理表明為了證明K是有效的核函式,那麼我們不用去尋找,而只需要在訓練集上求出各個,然後判斷矩陣K是否是半正定(使用左上角主子式大於等於零等方法)即可。
許多其他的教科書在Mercer定理證明過程中使用了L^2範數和再生希爾伯特空間等概念,但在特徵是n維的情況下,這裡給出的證明是等價的。

=========================

參考自:

1、互動百科

4、支撐向量機(三)核函式:http://www.cnblogs.com/jerrylead/archive/2011/03/18/1988406.html

相關推薦

函式徑向函式 (Radial Basis Function 簡稱 RBF)

轉載於 :http://blog.csdn.net/huang1024rui/article/details/51510611 1.核函式 1.1核函式的由來 -----------還記得為何要選用核函式麼?--

高斯函式徑向函式

數學表示所謂徑向基函式 (Radial Basis Function 簡稱 RBF), 就是某種沿徑向對稱的標量函式。 通常定義為空間中任一點x到某一中心xc之間歐氏距離的單調函式 , 可記作 k(||x-xc||), 其作用往往是區域性的 , 即當x遠離xc時函式取值很

機器學習 徑向(Radial basis function)RBF函式 淺析

徑向基函式(RBF)在神經網路領域扮演著重要的角色,如 RBF神經網路具有唯一最佳逼近的特性,徑向基作為核函式在SVM中能將輸入樣本對映到高維特徵空間,解決一些原本線性不可分的問題。       本文主要討論:        1. 先討論核函式是如何把資料對映到高維空

函式&徑向函式 (Radial Basis Function)--RBF

1.核函式 1.1核函式的由來 -----------還記得為何要選用核函式麼?----------- 對於這個問題,在Jasper's Java Jacal部落格《SVM入門(七)為何需要核函式

徑向函式 (Radial Basis Function)–RBF

論文中又提到了RBF,雖然是個簡單的核函式,但是也再總結一下。關於SVM中的核函式的選擇,比較簡單和應用比較廣的是RBF。 所謂徑向基函式 (Radial Basis Function 簡稱 RBF), 就是某種沿徑向對稱的標量函式。 通常定義為空間中任一點x到某一中心x

四.徑向函式網路

BP神經網路是一種全域性逼近網路,學習速度慢,本次介紹一種結構簡單,收斂速度快,能夠逼近任意非線性函式的網路——徑向基函式網路。(Radial Basis Function, RBF)是根據生物神經元有區域性響應的原理而將基函式引入到神經網路中。 為什麼RBF網路學習收斂得比較快?當網路的一個或多個可調引數

【Yaser S. Abu-Mostafa課件】從資料中學習——徑向函式

本課件主要內容包括: 基本RBF模型 學習演算法 用於分類的RBF 與最近鄰方法的關係 K箇中心的RBF 中心選擇的問題 迭代演算法 Lloyd演算法 中心與支援向量 RBF網路

徑向函式RBF)神經網路

RBF網路能夠逼近任意的非線性函式,可以處理系統內的難以解析的規律性,具有良好的泛化能力,並有很快的學習收斂速度,已成功應用於非線性函式逼近、時間序列分析、資料分類、模式識別、資訊處理、影象處理、系統建模、控制和故障診斷等。 簡單說明一下為什麼RBF網路學習收斂得比較快。當網路的一個或多個可調引數(權值或閾

RBF徑向函式)神經網路

自己的總結: 1、輸入層到隱藏層之間不是通過權值和閾值進行連線的,而是通過輸入樣本與隱藏層點之間的距離(與中心點的距離)連線的。 2、得到距離之後,將距離代入徑向基函式,得到一個數值。數值再與後邊的權值相乘再求總和,就得到了相應輸入的輸出。 3、在訓練網路之前,需要確定中心點的個數,和中心點

神經網路學習筆記(五) 徑向函式神經網路

徑向基函式神經網路 首先介紹一下網路結構: 1.輸入層為向量,維度為m,樣本個數為n,線性函式為傳輸函式。 2.隱藏層與輸入層全連線,層內無連線,隱藏層神經元個數與樣本個數相等,也就是n,傳輸函式為徑向基函式。 3.輸出層為線性輸出。 理論

MATLAB中的徑向函式

function [net,tr]=newrb(p,t,goal,spread,mn,df)%NEWRB Design a radial basis network.%%  Synopsis%%    net = newrb%    [net,tr] = newrb(P,T,

神經網路學習筆記(一) RBF徑向函式神經網路

RBF徑向基函式神經網路 初學神經網路,以下為綜合其他博主學習材料及本人理解所得。 一、RBF神經網路的基本思想 1. 用RBF作為隱單元的“基”構成隱含層空間,將輸入向量直接(不通過權對映)對映到隱空間。 2.當RBF的中心點確定後,對映關係也就確定。(中心點通常通

深度學習之徑向函式神經網路RBFNN

徑向基函式(Radial Basis Function)神經網路是具有唯一最佳逼近(克服區域性極小值問題)、訓練簡潔、學習收斂速度快等良好效能的前饋型神經網路,目前已證明RBFNN能夠以任意精度逼近任意連續的非線性網路,被廣泛用於函式逼近、語音識別、模式識別、影象處理、自

SQL Server排名函式排名開窗函式

什麼是排名函式?說實話我也不甚清楚,我知道 order by 是排序用的,那麼什麼又是排名函式呢? 接下來看幾個示例就明白了。 首先建立一個表,隨便插入一些資料。 ROW_NUMBER 函式:直接排序,ROW_NUMBER函式是以上升進行直接排序,並且以連續的順序給每一行資料一個唯一的序號。(即排名

SQL Server聚合函式聚合開窗函式

以下面這個表的資料作為示例。 什麼是聚合函式? 聚合函式:聚合函式就是對一組值進行計算後返回單個值(即分組)。聚合函式在計算時都會忽略空值(null)。 所有的聚合函式均為確定性函式。即任何時候使用一組相同的輸入值呼叫聚合函式執行後的返回值都是相同的,無二義性。 COUNT(統計函式):COUNT

函式純虛擬函式

虛解構函式 通過基類的指標刪除派生類物件時,通常情況只調用基類的解構函式 但是,刪除一個派生類物件時,應該先呼叫派生類的解構函式,然後呼叫基類的解構函式(構造時自頂向下,析構時自底向上) 這種情況會產生記憶體洩漏,最終導致系統應可用記憶體不足而崩潰 解決辦法 把基類的解構函式宣告為virtual,此

【轉載】鉤子函式回撥函式

在訊息處理機制中必不可少的一組CP,即回撥和鉤子。 鉤子的概念源於Windows的訊息處理機制,通過設定鉤子,應用程式可以對所有的訊息事件進行攔截,然後執行鉤子函式,對訊息進行想要的處理方式。 接下來是一段js程式碼,主要用於給btn設定點選的鉤子函式。 let btn = document.getEl

SQLServer 表值函式標量值函式 定義方式呼叫區別

SQLServer 表值函式與標量值函式 定義方式與呼叫區別 轉載自:http://blog.sina.com.cn/s/blog_648861b901012ay2.html SQLServer 

python中閉包函式裝飾器函式

閉包 首先知道閉包函式的語法特徵: 函式巢狀定義 外部函式返回內部函式的引用 內部函式可以呼叫外部函式的自由變數 外部函式的作用是建立內部函式並且返回內部函式的引用。 def line(k, b): """外部函式的作用: 建立內部函式並且返回內部函式的引用

PCB MS SQL 標量函式表值函式(CLR) 實現檔案目錄操作 PCB 工程系統 模擬windows域帳號登入

 一.C#寫SQL SERVER(CLR)實現檔案操作  標量函式: 檔案移動 ,複製,檢測檔案存在,寫入新檔案文字,讀取文字,建立目錄,刪除目錄,檢測目錄是否存在 /// <summary> /// 將現有檔案複