1. 程式人生 > >機器學習----無監督學習演算法之異常檢測

機器學習----無監督學習演算法之異常檢測

問題2:如何選取有用的features

方法:觀察已有的屬性分佈,畫出高斯分佈圖形,觀察到有些異常樣本被正常樣本包圍,思考原因,這時,可以試著新增一個新的feature,這個新的feature能夠將異常樣本從正常樣本中區分開。對每個不能被區分的樣本進行同樣的思考,這樣就有了能夠將的所有異常樣本區分來的features.


一個例子,如當x1,x2,x,x4不能將異常的computers從一個data center中區分開時,可以試圖新增x5,x6屬性,使之區分開。新新增的屬性可以是已有屬性的數學組合。


(五)多元高斯分佈

將所有的features為軸定義為一個n為空間的高斯分佈,其中均值是一個1*n的矩陣,標差是一個n*n的矩陣。


一些例子如下:







(六)使用多元高斯分佈的異常檢測

1、均值和方差的選取:


2、多遠高斯分佈的異常檢測模型和一般高斯分佈的異常模型的使用區別