【轉】SVM入門（六）線性分類器的求解——問題的轉化，直觀角度

阿新 • • 發佈：2017-07-13

content cli 樣本 image ges 五個是你角度 spa

SVM入門（六）線性分類器的求解——問題的轉化，直觀角度

讓我再一次比較完整的重復一下我們要解決的問題：我們有屬於兩個類別的樣本點（並不限定這些點在二維空間中）若幹，如圖，

技術分享

圓形的樣本點定為正樣本（連帶著，我們可以把正樣本所屬的類叫做正類），方形的點定為負例。我們想求得這樣一個線性函數（在n維空間中的線性函數）：

g(x)=wx+b

使得所有屬於正類的點x₊代入以後有g(x₊)≥1，而所有屬於負類的點x_-代入後有g(x_-)≤-1（之所以總跟1比較，無論正一還是負一，都是因為我們固定了間隔為1，註意間隔和幾何間隔的區別）。代入g(x)後的值如果在1和-1之間，我們就拒絕判斷。

求這樣的g(x)的過程就是求w（一個n維向量）和b（一個實數）兩個參數的過程（但實際上只需要求w，求得以後找某些樣本點代入就可以求得b）。因此在求g(x)的時候，w才是變量。

你肯定能看出來，一旦求出了w（也就求出了b），那麽中間的直線H就知道了（因為它就是wx+b=0嘛，哈哈），那麽H1和H2也就知道了（因為三者是平行的，而且相隔的距離還是||w||決定的）。那麽w是誰決定的？顯然是你給的樣本決定的，一旦你在空間中給出了那些個樣本點，三條直線的位置實際上就唯一確定了（因為我們求的是最優的那三條，當然是唯一的），我們解優化問題的過程也只不過是把這個確定了的東西算出來而已。

樣本確定了w，用數學的語言描述，就是w可以表示為樣本的某種組合：

w=α₁x₁+α₂x₂+…+α_nx_n

式子中的α_i是一個一個的數（在嚴格的證明過程中，這些α被稱為拉格朗日乘子），而x_i是樣本點，因而是向量，n就是總樣本點的個數。為了方便描述，以下開始嚴格區別數字與向量的乘積和向量間的乘積，我會用α₁

x₁表示數字和向量的乘積，而用<x₁,x₂>表示向量x₁,x₂的內積（也叫點積，註意與向量叉積的區別）。因此g(x)的表達式嚴格的形式應該是：

g(x)=<w,x>+b

但是上面的式子還不夠好，你回頭看看圖中正樣本和負樣本的位置，想像一下，我不動所有點的位置，而只是把其中一個正樣本點定為負樣本點（也就是把一個點的形狀從圓形變為方形），結果怎麽樣？三條直線都必須移動（因為對這三條直線的要求是必須把方形和圓形的點正確分開）！這說明w不僅跟樣本點的位置有關，還跟樣本的類別有關（也就是和樣本的“標簽”有關）。因此用下面這個式子表示才算完整：

w=α₁y₁x₁+α₂y₂x₂+…+α_n

y_nx_n （式1）

其中的y_i就是第i個樣本的標簽，它等於1或者-1。其實以上式子的那一堆拉格朗日乘子中，只有很少的一部分不等於0（不等於0才對w起決定作用），這部分不等於0的拉格朗日乘子後面所乘的樣本點，其實都落在H1和H2上，也正是這部分樣本（而不需要全部樣本）唯一的確定了分類函數，當然，更嚴格的說，這些樣本的一部分就可以確定，因為例如確定一條直線，只需要兩個點就可以，即便有三五個都落在上面，我們也不是全都需要。這部分我們真正需要的樣本點，就叫做支持（撐）向量！（名字還挺形象吧，他們“撐”起了分界線）

式子也可以用求和符號簡寫一下：

技術分享

因此原來的g(x)表達式可以寫為：

技術分享

註意式子中x才是變量，也就是你要分類哪篇文檔，就把該文檔的向量表示代入到 x的位置，而所有的x_i統統都是已知的樣本。還註意到式子中只有x_i和x是向量，因此一部分可以從內積符號中拿出來，得到g(x)的式子為：

技術分享

發現了什麽？w不見啦！從求w變成了求α。

但肯定有人會說，這並沒有把原問題簡化呀。嘿嘿，其實簡化了，只不過在你看不見的地方，以這樣的形式描述問題以後，我們的優化問題少了很大一部分不等式約束（記得這是我們解不了極值問題的萬惡之源）。但是接下來先跳過線性分類器求解的部分，來看看 SVM在線性分類器上所做的重大改進——核函數。

【轉】SVM入門（六）線性分類器的求解——問題的轉化，直觀角度

content cli 樣本 image ges 五個是你角度 spa SVM入門（六）線性分類器的求解——問題的轉化，直觀角度讓我再一次比較完整的重復一下我們要解決的問題：我們有屬於兩個類別的樣本點（並不限定這些點在二維空間中）若幹，如圖，圓形的樣本點定為正樣

【轉】SVM入門（六）線性分類器的求解——問題的轉化，直觀角度

【轉】SVM入門（六）線性分類器的求解——問題的轉化，直觀角度

【轉】VBA 入門（一）

【轉】Storm入門（一）原理介紹

【轉】JMeter學習（四）參數化

【轉】JMeter學習（三）元件的作用域與執行順序

【轉】JMeter學習（二）錄制腳本

轉：TensorFlow入門（六）雙端 LSTM 實現序列標註（分詞）

【轉】取模（mod）與取余（rem）的區別——Matlab學習筆記

【vue】vue入門（二）

【vue】vuejs入門（一）

【React】歸納篇（六）元件物件的生命週期 | 例項 | 虛擬DOM與DOM Diff演算法

【轉】USB命令（請求）和USB描述符

【轉】交換機開發（二）—— 三層交換機報文轉發過程

【轉】交換機開發（四）—— ARP 基礎知識解析

【轉】強化學習（一）Deep Q-Network

【轉】強化學習（二）

【轉】Java Collection（集合）必考面試題

【Angular】新手入門（一）

【tensorflow】TensorFlow入門（五）多層 LSTM 通俗易懂版

【轉】取模（mod）與取餘（rem）的區別——Matlab學習筆記

【轉】SVM入門（六）線性分類器的求解——問題的轉化，直觀角度

相關推薦