SVM多分類的兩種方式

阿新 • • 發佈：2019-01-11

SVM本身是一個二值分類器，SVM演算法最初是為二值分類問題設計的，當處理多類問題時，就需要構造合適的多類分類器。目前，構造SVM多類分類器的方法主要有兩類，直接法、間接法。

一直接法

直接在目標函式上進行修改，將多個分類面的引數求解合併到一個最優化問題中，通過求解該最優化問題“一次性”實現多類分類。這種方法看似簡單，但其計算複雜度比較高，實現起來比較困難，只適合用於小型問題中；

二間接法

主要是通過組合多個二分類器來實現多分類器的構造，常見的方法有one-against-one和one-against-all兩種。

（1）一對多法（one-versus-rest,簡稱OVR SVMs）

　　訓練時依次把某個類別的樣本歸為一類,其他剩餘的樣本歸為另一類，這樣k個類別的樣本就構造出了k個SVM。分類時將未知樣本分類為具有最大分類函式值的那類。

　　假如我有四類要劃分（也就是4個Label），他們是A、B、C、D。

　　於是我在抽取訓練集的時候，分別抽取

　　（1）A所對應的向量作為正集，B，C，D所對應的向量作為負集；

　　（2）B所對應的向量作為正集，A，C，D所對應的向量作為負集；

　　（3）C所對應的向量作為正集，A，B，D所對應的向量作為負集；

　　（4）D所對應的向量作為正集，A，B，C所對應的向量作為負集；

　　使用這四個訓練集分別進行訓練，然後的得到四個訓練結果檔案。

　　在測試的時候，把對應的測試向量分別利用這四個訓練結果檔案進行測試。

　　最後每個測試都有一個結果f1(x),f2(x),f3(x),f4(x)。

　　於是最終的結果便是這四個值中最大的一個作為分類結果。

評價

優點：訓練k個分類器，個數較少，其分類速度相對較快。

缺點：

①每個分類器的訓練都是將全部的樣本作為訓練樣本，這樣在求解二次規劃問題時，訓練速度會隨著訓練樣本的數量的增加而急劇減慢；

②同時由於負類樣本的資料要遠遠大於正類樣本的資料，從而出現了樣本不對稱的情況，且這種情況隨著訓練資料的增加而趨向嚴重。解決不對稱的問題可以引入不同的懲罰因子，對樣本點來說較少的正類採用較大的懲罰因子C；

③還有就是當有新的類別加進來時，需要對所有的模型進行重新訓練。

從“一對多”的方法又衍生出基於決策樹的分類：

首先將所有類別分為兩個類別，再將子類進一步劃分為兩個次級子類，如此迴圈下去，直到所有的節點都只包含一個單獨的類別為止，此節點也是二叉樹樹種的葉子。該分類將原有的分類問題同樣分解成了一系列的兩類分類問題，其中兩個子類間的分類函式採用SVM。下圖引用出自於王正海《基於決策樹多分類支援向量機巖性波譜分類》

（2）一對一法（one-versus-one,簡稱OVO SVMs或者pairwise）

　　其做法是在任意兩類樣本之間設計一個SVM，因此k個類別的樣本就需要設計k(k-1)/2個SVM。

　　當對一個未知樣本進行分類時，最後得票最多的類別即為該未知樣本的類別。

　　Libsvm中的多類分類就是根據這個方法實現的。

　　假設有四類A,B,C,D四類。在訓練的時候我選擇A,B; A,C; A,D; B,C; B,D;C,D所對應的向量作為訓練集，然後得到六個訓練結果，在測試的時候，把對應的向量分別對六個結果進行測試，然後採取投票形式，最後得到一組結果。

　　投票是這樣的：
　　A=B=C=D=0;
　　(A,B)-classifier 如果是A win,則A=A+1;otherwise,B=B+1;
　　(A,C)-classifier 如果是A win,則A=A+1;otherwise, C=C+1;
　　...
　　(C,D)-classifier 如果是A win,則C=C+1;otherwise,D=D+1;
　　The decision is the Max(A,B,C,D)

評價：這種方法雖然好,但是當類別很多的時候,model的個數是n*(n-1)/2,代價還是相當大的。

評價：

優點：不需要重新訓練所有的SVM，只需要重新訓練和增加語音樣本相關的分類器。在訓練單個模型時，相對速度較快。

缺點：所需構造和測試的二值分類器的數量關於k成二次函式增長，總訓練時間和測試時間相對較慢。

從“一對一”的方式出發，出現了有向無環圖（DirectedAcyclic Graph）的分類方法。

圖1 有向無環圖

直接方法儘管看起來簡潔，但是在最優化問題求解過程中的變數遠遠多於第一類方法，訓練速度不及間接方法，而且在分類精度上也不佔優。當訓練樣本數非常大時，這一問題更加突出。正因如此，間接方法更為常用。

SVM多分類的兩種方式

一直接法

二間接法

（1）一對多法（one-versus-rest,簡稱OVR SVMs）

（2）一對一法（one-versus-one,簡稱OVO SVMs或者pairwise）

SVM多分類的兩種方式

java基礎——java類復用的兩種方式及多態

創建多線程的兩種方式

Java中實現多線程的兩種方式

實現多線程的兩種方式

操作系統，編程語言分類，執行python兩種方式，變量，內存管理，定義變量的三個特征

Java多線程Thread使用匿名內部類創建的兩種方式

php實現無限級分類的兩種方式

python並發編程：多線程-開啟線程的兩種方式

C語言中存儲多個字符串的兩種方式

java實現多線程的兩種方式

multiprocessing多進程（31-04）創建進程的兩種方式

實現多線程的兩種方式，賣票場景，親測可用

python多執行緒———2、建立多執行緒的兩種方式

Python多工（2.執行緒(建立執行緒的兩種方式)）

fastDFS+LibreOffice多檔案上傳(二)後端部分：檔案資訊轉json字串儲存資料庫(Gson和org.json兩種方式)

java:多執行緒(匿名內部類實現執行緒的兩種方式)

python中多執行緒開啟的兩種方式（內含有event的應用，即安全的機制，類似於java的等待喚醒機制，不會出現多個執行緒之間的錯亂問題）

PHP實現無限極分類的兩種方式，遞迴和引用

java實現多執行緒的兩種方式

SVM多分類的兩種方式

一 直接法

二 間接法

（1）一對多法（one-versus-rest,簡稱OVR SVMs）

（2）一對一法（one-versus-one,簡稱OVO SVMs或者pairwise）

相關推薦

一直接法

二間接法