支援向量機（SVM）（三）----核函式及正則化

阿新 • • 發佈：2019-01-10

上一節最後我們說到我們根據求得的，可求得，，然後求出決策函式，但是我們知道：

是的函式，我們也許不必把帶入上式來求解，我們直接把上式帶入決策函式可有：

假如我們已經求得最優的，在作出預測的時候，我們可以只進行輸入資料x與訓練樣本的內積即可。在轉化為對偶條件的時候，我們知道要滿足KKT條件，KKT條件中有一個是：

其中：

由此可以知道，若，則有函式間隔必然等於1，也就是說，只有支援向量滿足，而不是支援向量的樣本點，必然有。故而在計算下式的時候，我們只需考慮支援向量，而是支援向量的樣本點有很少，所以這樣會降低計算複雜度。這種形式也為引入核函式做出鋪墊。

Kernels

我們上次最後說明了，如果遇到線性不可分的情況，根據現有的分類函式，可能解決不了，比如，下圖（來源：知乎）

上圖中的紅點服從，藍點服從，很明顯紅藍點是不可分的，但是通過對映,將其對映到三維空間後，便有：

對映到三維空間之後，紅藍點變得線性可分了。核函式作用其實就是通過一個對映，把低維線性不可分的樣本點，對映到高維中，使之變得線性可分。

吳恩達老師說，“原始”的輸入我們稱之為問題的屬性，當“原始”輸入經過對映得到一個新的集合，而這個集合傳遞給學習演算法，這樣的一個新的集合稱之為特徵。SVM的輸入就是特徵而不是原始的輸入屬性。當低維線性不可分的時候，我們把輸入屬性，對映到一個高維特徵空間，並把對映後的特徵作為新的輸入，而新的決策函式，只是把原來的內積運算<x,z>簡單替換為

即可。而接下我們探討這個核函式。

核函式定義為：

其中的為對映函式。

憑直覺來看，要求出，我們需要求出，然而要求代價是很大的，因為很難求得，另外當高維的維數很大的時候（這是很有可能的），我們的計算量也是很大的，這讓我們很難承受，那麼我們可不可以把的值在低維求出呢？

我們先看一個例子：

我們可以把上式寫成如下的形式：

假如當N=3時，那麼就是如下形式：

對於這個例子，我們在高維中計算的時間複雜度為，而在輸入屬性中計算，只需的時間，這樣給了我們啟發，對於高維中的內積，我們在低維中就可以解決。

對於kernel,我們有多項式kernel，Gaussian kernel等等，那麼給定一個函式K，我們怎麼知道他是不是有效的呢？也就是說對於所有的x,z是否存在一個對映

，使得

成立？

假如K是有效的，那麼有，因此K一定是對稱的。另外我們令表示向量的第k個座標，對於任意向量z有：

這就說明了如果K是有效的，那麼其對應的核矩陣就是半正定的。這是一個充分必要條件，也是Mercer定理。好了到此我們也說明了什麼是核函式。下一節我們將繼續上一節的話題，怎麼樣求解對偶問題的解。請看：

支援向量機（SVM）（三）----核函式及正則化

上一節最後我們說到我們根據求得的，可求得，，然後求出決策函式，但是我們知道：是的函式，我們也許不必把帶入上式來求解，我們直接把上式帶入決策函式可有：假如我們已經求得最優的，在

支援向量機之SVM演算法庫(scikit-learn)（三）

1. SVM核函式概述　　　　在scikit-learn中，內建的核函式一共有4種，當然如果你認為線性核函式不算核函式的話，那就只有三種。　　　　1）線性核函式（Linear Kernel）表示式為：K(x,z)=x∙zK(x,z)=x∙z，就是普通的內積，LinearSVC 和 Linea

基於支援向量機的影象分類（下篇：MATLAB實現）

摘要：本文通過圖文詳細介紹如何利用支援向量機對影象進行分類，經過上篇文章對原理的介紹，這裡介紹利用MATLAB程式設計實現。後續章節將介紹的主要部分有：圖片資料集整理特徵提取 SVM訓練與測試分類結果評價結果顯示 1. 前言機器學習是人工智慧

基於支援向量機的影象分類（上篇）

摘要：本文通過圖文詳細介紹如何利用支援向量機對影象進行分類。這篇文章從什麼是影象分類任務開始一步步詳細介紹支援向量機原理，以及如何用它解決影象多分類任務。將這部分內容分為上下兩篇：上篇重點詳細介紹實現原

支援向量機SMO演算法實現（原始碼逐條解釋）

支援向量機號稱機器學習中最好的演算法——存在最優解，而且一般問題都可以得解。但是演算法需要的儲存空間和計算複雜度較大，不大適合大資料量的運算，不過經過platt發明的SMO簡化運算後，效率可以提高很多。以下是筆者用Matlab語言寫的支援向量機兩分類問題的原始碼，因為在網路

支援向量機：SVM

SVM 是一種監督式的機器學習演算法，可用於分類或迴歸問題。它使用一種稱為核函式的技術來變換資料，然後基於這種變換，演算法找到預測可能的兩種分類之間的最佳邊界。通俗來講，它是一種二類分類模型，其基本模型定義為特徵空間上的間隔最大的線性分類器，即支援向量機的學習策略便是間隔最大化，最終

機器學習---演算法---支援向量機---線性SVM--第一部分

轉自：https://cuijiahua.com/blog/2017/11/ml_8_svm_1.html 什麼是SVM？ SVM的英文全稱是Support Vector Machines，我們叫它支援向量機。支援向量機是我們用於分類的一種演算法。讓我們以一個小故事的形式，開啟我們的SVM之旅吧。在很

二分類支援向量機模型SVM知識點詳解

1 引言在本篇部落格中，你將會了解到支援向量機分類器名字的由來、它的基本假設、支援向量機針對線性可分、廣義線性、非線性情況下的解決方法以及一些具體的推導過程，支援向量機常見問題的解答。在本篇部落格的第二部分會給一幅支援向量機整個過程的流程圖，從圖中你可以清晰

CS231n課程筆記3.1：線性分類器（SVM，softmax）的誤差函式、正則化

CS231n簡介課程筆記這篇是線性分類器的第二部分，回憶線性分類器的線性體現在score的獲得，即score = Wx+b，然後predict_label = argmax(score)。具體細節以及關於線性分類器的解釋請參考CS231n課程筆記

機器學習筆記（四）Logistic迴歸實現及正則化

一、Logistic迴歸實現（一）特徵值較少的情況 1. 實驗資料吳恩達《機器學習》第二課時作業提供資料1。判斷一個學生能否被一個大學錄取，給出的資料集為學生兩門課的成績和是否被錄取，通過這些資料來預測一個學生能否被錄取。 2. 分類結果評估橫縱軸（特徵）為學生兩門課成績，可以在圖

機器學習筆記（五）過擬合問題及正則化

一、過擬合問題 1. 引入線性迴歸當中：假設我們拿出房屋面積與房價的資料集，隨著面積的增大，房價曲線趨於平緩。第一個模型不能很好地擬合，具有高偏差（欠擬合）。我們加入二次項後曲線可以較好的擬合，用第三個模型去擬合時，它通過了所有的資料點，但它是一條扭曲的線條，不停上下波動，我們並

資料預處理中歸一化（Normalization）與損失函式中正則化（Regularization）解惑

背景：資料探勘/機器學習中的術語較多，而且我的知識有限。之前一直疑惑正則這個概念。所以寫了篇博文梳理下摘要：　　1.正則化（Regularization）　　　　1.1 正則化的目的　　　　　1.2 結構風險最小化（SRM）理論　　　　1.3 L1範數

三個層面、三個不同角度理解正則化

全文摘要 “正則化”這是機器學習和深度學習都在不斷用到的一個技術手段，也是解決模型模型過擬合最常用的手段，但是很少有文章真正講的深入徹底，本文是在之前自己的一篇博文的基礎之上進行補充的，將再次從“三個不同層面”解釋正則化，本文只針對L1、L2正則化。三個不同層面理解“正則化

Stanford機器學習---第三週.邏輯迴歸、正則化

第三週邏輯迴歸與正則化學完前三週簡要做個總結，梳理下知識框架：第一講邏輯迴歸Logistic Regression 1.分類問題Classification Problem for e

詳解SVM系列（三）：線性可分支援向量機與硬間隔最大化

支援向量機概覽（support vector machines SVM）支援向量機是一種二類分類模型。它的基本模型是定義在特徵空間上的間隔最大（間隔最大區別於感知機）線性分類器（核函式可以用非線性的分類）。支援向量機的學習策略是間隔最大化可形式化為一個求解凸二次規劃的問題。也等

SVM支援向量機系列理論（三）非線性支援向量機與核函式技巧

3.1 核技巧解決非線性SVM 3.1.1 非線性SVM解決思路 3.1.2 核技巧下SVM 3.2 Mercer核

支援向量機（SVM）和python實現（三）

6. python實現根據前面的一步步推導獲得的結果，我們就可以使用python來實現SVM了這裡我們使用iris資料集進行驗證，由於該資料集有4維，不容易在二維平面上表示，我們先使用LDA對其進行降維，又因為該資料集有3類樣本，我們編寫的SVM是二分類的，所以我們將

機器學習（三）——支援向量機SVM

SVM探討目錄 SVM探討 SVM演算法根據處理問題的複雜度，SVM 可由簡到繁分為三種：線性可分支援向量機：硬間隔最大化。線性支援向量機：資料分佈近似線性可分，可通過軟間隔最大化(懲罰因子，鬆弛變數)來線性分隔樣本點。非線性支援向量機：通過核函式提升

支援向量機SVM（三）：基於核函式的非線性SVM

前言線性分類SVM是一種線性分類非常有效的方法，若分類問題是非線性，需要考慮對資料進行空間變換，將非線性分類問題轉變為線性分類問題，使非線性SVM的學習轉變為線性SVM的學習。若使用對映ϕ\phiϕ將例項從原空間X\mathcal XX（一般為歐式空

支援向量機通俗導論（理解SVM的三層境界）

作者：July 。致謝：pluskid、白石、JerryLead。說明：本文最初寫於2012年6月，而後不斷反反覆覆修改&優化，修改次數達上百次，最後修改於2016年11月。宣告：本文於2012年便早已附上所有參考連結，並註明是篇“學習筆記”，