1. 程式人生 > >斯坦福NG機器學習課程:Anomaly Detection筆記

斯坦福NG機器學習課程:Anomaly Detection筆記

Anomaly DetectionVS Supervised Learning 

說到這裡我們肯定都有困惑,當我們有資料類標籤,為什麼我們不直接使用監督性學習而使用Anomaly detection,接下來就對兩者進行對比。


首先Anomaly detection 在資料集上特點是:很少量的positive 資料,很大量的negative資料,這樣我們使用大量的negative資料能夠好的擬合求得聯合高斯概率密度函式。而supervised learning中 positive negative資料量都大。

其次我們有不同型別的異常資料,但是異常資料量很小,任何演算法都很難在小的Anomaly資料集上學習得到Anomaly是什麼樣子。上面兩者對比是你應用Anomaly detection 還是supervise learning 的一些重要區分標準。

Spam是經常提到的一種學習系統,雖然我們有很多型別的Spam,但是每種型別的Spam我們都有比較多的資料,所以Spam問題我們應用的是supervise learning。

其實這兩種狀態並不是完全分割的,舉例說如果我們在交易時有很多為Fraud的,則我們學習問題由Anomaly detection 轉變為supervise learning。