1. 程式人生 > >關於什麼時候用異常檢測和監督學習,以及多元高斯模型的使用

關於什麼時候用異常檢測和監督學習,以及多元高斯模型的使用


當有很多負樣本,少量正樣本的時候,用異常檢測。

假如特徵不符合高斯分佈,則應該對原始特徵做一個變換,比如log(x)或者X^2等等讓其符合高斯分佈

多元高斯混合模型公式:


其中裡面有兩個引數一個是u特徵均值,一個是協方差矩陣


混合高斯模型使用條件 m(訓練樣本數量)>n(特徵數量),否則協方差矩陣不可逆,無法求解。吳老師的建議是m>=10n。

還有一種情況是樣本特徵中出現了冗餘特徵,既有x1=x2或者是x1 = x2+x3線性組合,在這樣的情況下使用高斯混合模型也會出錯。

下面是傳統模型和混合高斯的使用對比:


當然使用原模型可能對於單個特徵x1和x2來說,並沒有發現異常,只有當把x1,x2組合在一起的時候才會形成異常。故我們需要手動建立一個新的特徵X3=x1/x2這樣,讓兩者關聯起來,