1. 程式人生 > >從二分類到多分類的遷移策略

從二分類到多分類的遷移策略

一般情況下問題研究為二分類問題,在解決多分類問題時有時可以直接推廣到多分類,有時不能,不能推廣的時候主要用三種拆分策略對問題進行研究

一對一的策略 給定資料集DD這裡有NN個類別,這種情況下就是將這些類別兩兩配對,從而產生N(N−1)/2個二分類任務,在測試的時候把樣本交給這些分類器,然後進行投票

一對其餘策略 將每一次的一個類作為正例,其餘作為反例,總共訓練NN個分類器。測試的時候若僅有一個分類器預測為正的類別則對應的類別標記作為最終分類結果,若有多個分類器預測為正類,則選擇置信度最大的類別作為最終分類結果。

多對多分類策略 基於一種糾錯輸出碼的分類策略,分為兩個步驟

編碼:對NN個類別做MM次劃分,每次劃分將一部分類別劃為正類,一部分劃為反類,從而形成一個二分類訓練集,這樣一共產生MM個訓練集,可訓練出MM個分類器

**解碼**M個分類器分別對測試樣本進行預測,這些預測標記組成一個編碼。將這個預測編碼與每個類別各自的編碼進行比較,返回其中距離最小的類別作為最終預測的結果

這裡的類別劃分通過編碼矩陣指定,編碼矩陣主要有,二元碼(每個類別分別指定正類反類),三元碼(正,反,停用)

一般來說編碼越長則糾錯能力越強,但是意味著所需訓練的分類器越多,計算儲存的開銷越大,不一定得到越好的訓練效果,因為跟把樣本進行分組也有關係