摘要：本文通過圖文詳細介紹如何利用支援向量機對影象進行分類。這篇文章從什麼是影象分類任務開始一步步詳細介紹支援向量機原理，以及如何用它解決影象多分類任務。將這部分內容分為上下兩篇：上篇重點詳細介紹實現原理，下篇銜接上篇進行程式設計實現並對程式進行解釋，本篇為上篇。本文將主要介紹以下幾個方面：

影象分類任務
收集訓練集與測試集
支援向量機分類基本原理
特徵選擇與提取
用SVM 進行影象分類
分類結果評價

1. 影象分類任務

影象分類是模式分類(Pattern C1assification)在影象處理中的應用，它完成將影象資料從二維灰度空間轉換到目標模式空間的工作。分類的結果是將影象根據不同屬性劃分為多個不同類別的子區域。一般地，分類後不同的影象區域之問性質差異應儘可能的大，而區域內部性質應保證平穩特性。

應用SVM進行分類的步驟如下：首先收集各個類的訓練集和測試集，接著選擇合適的用來分類的影象特徵，從訓練集中提取特徵，然後用SVM分類器訓練從而得到分類模板，最後通過模板對待分類影象進行分類。

2. 收集訓練集與測試集

在進行影象分類前，從待處理的資料中取出相當數量的具有代表性的資料作為訓練樣本。另外，取出一定數量的樣本作為測試樣本。這個工作很重要，在演算法上沒有改進的空間時，通常通過建立好的訓練集來提高分類效果。訓練集要滿足以下的條件：(1)訓練集要有代表性。(2)訓練集中不能有錯誤的樣本。(3)訓練集要儘量完備

cifar10影象集是常用的影象分類資料集，由多倫多大學的Geoffrey Hinton教授等人收集整理，包含了60000張大小為32*32的彩色影象，其中50000張作為訓練資料，10000張用於測試資料。50000張訓練圖片分為5個子集，分別命名為data_batch_1~5。每個子集都包含正好10000張圖片，cifar10包含的圖片類別如下圖所示

3. 支援向量機分類基本原理

SVM是以最優化理論為基礎來處理機器學習的新方式。它的提出主要是用來解決兩類分類的問題，在兩類中尋找一個最優超分平面將兩類分開，來提高分類的正確率。

分類問題主要包括兩方面：一個是線性可分，一個是非線性可分。能使兩類正確分開且使兩類之間的距離最大的分類平面稱為最優超平面，其方程記為：

w \cdot x - b = 0

對其進行歸一化，使得樣本

(x_{i}, y_{i}), i = 1, . . ., n, x ϵ R^{d}, y ϵ {+ 1, - 1}

滿足

y_{i} [(w, x_{i}) - b] - 1 \geq 0, i = 1, . . ., n

是表示的是最優分類超平面，圖中m1為分類超平面，m2、m3分別為與超分平面平行且是過兩類中離分類超平面最近的樣本，他們間的距離稱作分類間隔，間距為

2 / ‖ w ‖

。

3.1 線性可分情況

設線性可分樣本集為 $(x_{1}, y_{1}), \dots, (x_{l}, y_{l})$ ， $x_{i} \in R^{n}, y_{i} = 1, - 1, i = 1, \dots, l$ ，則超平面 $ω^{T} x + b = 0$ ，使得訓練樣本中的正類輸入和負類輸入分別位於該超平面的兩側。即存在引數對 $(ω, b)$ ，使得 $y_{i} = s g n (ω^{T} x + b), i = 1, \dots, l ， Z$ ，即最優分類平面應使兩類之間的間隔最大，則求取最優平面問題轉化為了下面的優化問題： $m i n : J (w, b, a) = \frac{1}{2} w^{T} w - \sum_{i = 1}^{N} a_{i} [y_{i} (w^{T} x_{i} + b) - 1]$ $y_{i} (ω_{i}^{T} x_{i} + b) \geq + 1$
其中， $a_{i}$ 為約束的拉格朗日乘子，因為都是不等式約束，所以這些乘子都是非負的。對式(1)求偏導得： $Q (a) = \sum_{j = 1}^{N} a_{i} - \frac{1}{2} \sum_{i = 1}^{N} \sum_{j = 1}^{N} a_{i} a_{j} y_{i} y_{j} (x_{i}, x_{j})$

相關推薦

基於支援向量機的影象分類（上篇）

摘要：本文通過圖文詳細介紹如何利用支援向量機對影象進行分類。這篇文章從什麼是影象分類任務開始一步步詳細介紹支援向量機原理，以及如何用它解決影象多分類任務。將這部分內容分為上下兩篇：上篇重點詳細介紹實現原

基於支援向量機的影象分類（下篇：MATLAB實現）

摘要：本文通過圖文詳細介紹如何利用支援向量機對影象進行分類，經過上篇文章對原理的介紹，這裡介紹利用MATLAB程式設計實現。後續章節將介紹的主要部分有：圖片資料集整理特徵提取 SVM訓練與測試分類結果評價結果顯示 1. 前言機器學習是人工智慧

skiti-learn 支援向量機類庫（SVM）

SVM演算法庫分為兩類，一類是分類演算法庫，SVC，NuSVC,LinearSVC；另一類是迴歸演算法庫，SVR,NuSVR,LinearSVR。分類演算法庫中，SVC，NuSVC差不多，區別在於損失的度量方式不同；LinearSVC是線性分類，不支援從低維到高維的核函式，僅僅支援線性核函

SVM支援向量機系列理論（九）核嶺迴歸

1. 嶺迴歸問題嶺迴歸就是使用了L2正則化的線性迴歸模型。當碰到資料有多重共線性時（自變良量存在高相關性），我們就會用到嶺迴歸。嶺迴歸模型的優化策略為： minw 1N∑i(yi−w⋅zi)2+λNwTw&nbs

SVM支援向量機系列理論（七）線性支援向量機與L2正則化 Platt模型

7.1 軟間隔SVM等價於最小化L2正則的合頁損失上一篇說到， ξi ξ i \xi_i 表示偏離邊界的度量，若樣本點

SVM支援向量機系列理論（四）軟間隔支援向量機

4.1 軟間隔SVM的經典問題 4.2 軟間隔SVM的對偶問題 4.2.1 軟間隔SVM的對偶問題學習演算法 4.3 軟間

SVM支援向量機系列理論（六） SVM過擬合的原因和SVM模型選擇

6.1 SVM 過擬合的原因實際我們應用的SVM模型都是核函式+軟間隔的支援向量機，那麼，有以下原因導致SVM過擬合：選擇的核函式過於powerful，比如多項式核中的Q設定的次數過高要求的間隔過大，即在軟間隔支援向量機中C的引數過大時，表示比較重視間隔，堅持要資

SVM支援向量機系列理論（五）SVM中幾種核函式的對比

核函式可以代表輸入特徵之間特殊的相似性。 5.1 線性核形式： K(x,x′)=xTx′ K ( x ,

SVM支援向量機系列理論（三）非線性支援向量機與核函式技巧

3.1 核技巧解決非線性SVM 3.1.1 非線性SVM解決思路 3.1.2 核技巧下SVM 3.2 Mercer核

SVM支援向量機系列理論（二）線性可分SVM模型的對偶問題

2.1 對偶問題 2.1.1 原始問題的轉換 2.2.2 強對偶性和弱對偶性 2.3.3 SVM模型的對偶問題形式求解

支援向量機之推導（二）

SVM演算法要解決的是一個最優分類器的設計問題線性SVM演算法的數學建模一個最優化問題通常有兩個最基本的因素：1）目標函式，也就是你希望什麼東西的什麼指標達到最好；---- 分類間隔2）優化物件，你期望通過改變哪些因素來使你的目標函式達到最優。---決策面線上性SVM演算法中，目標函式顯然就是那個

支援向量機通俗導論（理解SVM的三層境界）

作者：July 。致謝：pluskid、白石、JerryLead。說明：本文最初寫於2012年6月，而後不斷反反覆覆修改&優化，修改次數達上百次，最後修改於2016年11月。宣告：本文於2012年便早已附上所有參考連結，並註明是篇“學習筆記”，

機器學習之旅：支援向量機通俗導論（理解SVM的三層境界）

支援向量機通俗導論（理解SVM的三層境界）作者：July、pluskid ；致謝：白石、JerryLead出處：結構之法演算法之道blog。前言動筆寫這個支援向量機(support vector machine)是費了不少勁和困難的，原因很簡單，一者這個東西本身就並

支援向量機——非線性分類SVM

模型原型 sklearn.svm.SVC(C=1.0,kernel=’rbf’,degree=3,gamma=’auto’,coef0=0.0,shrinking=True,probability=False,tol=0.001,cache_size=200,

R語言基於支援向量機訓練模型實現類預測

前面介紹了基於訓練集訓練SVM的方法。通過訓練，演算法能找到使間隔區間最大化的最優平面來分割訓練資料集，得到SVM模型能夠被用來預測新到樣例的類別。準備使用之前構建的churn構建的model. 操作利用已構建的SVM模型和測試資料集的屬性

【轉載】支援向量機通俗導論（理解SVM的三層境界）

前言第一層、瞭解SVM 1.0、什麼是支援向量機SVM 1.1、線性分類 1.2、線性分類的一個例子 1.3、函式間隔Functional margin與幾何間隔Geometrical margin 1.3.1、函式間隔Functional margin 1.3.2、點到超平面的距離定

PCA+支援向量機-人臉識別（五）

一）：實驗準備對於上篇中資料庫ORL人臉庫和AR人臉庫（下載地址在上篇中有），在上篇中討論的單純的PCA演算法對兩個資料庫進行了準確率計算，本篇為了提高識別準確率，特採用一種新方法，並結合PCA一起實現識別，實驗結果發現該方法能明顯提高兩者資料庫的識別率。二）：關

支援向量機通俗導論（一）

第一層、瞭解SVM 支援向量機，因其英文名為support vector machine，故一般簡稱SVM，通俗來講，它是一種二類分類模型，其基本模型定義為特徵空間上的間隔最大的線性分類器，其學習策略

深度學習與支援向量機的分類原理異同

深度學習利用神經網路對資料進行分類，我們來看看其分類的本質是什麼。下面我們來看一個2層的神經網路中的第1層：輸入a可以看作三維空間的一個點，輸出z可以看作兩維空間的點。從輸入a到輸出z，首先輸入向量a左乘了一個變換矩陣w，經歷了座標變換被壓縮了一維，然後再進行了一個sigmo

支援向量機通俗導論（理解SVM的三層境界）(2)

第二層、深入SVM 2.1、從線性可分到線性不可分 2.1.1、從原始問題到對偶問題的求解接著考慮之前得到的目標函式：由於求的最大值相當於求的最小值，所以上述目標函式等價於（w由分母變成分子，從而也有原來的max問題變為min問題，很明顯，兩者問