異常點/離群點檢測算法——LOF

阿新 • • 發佈：2017-08-04

實現 div 剔除註意 out 兩種們的 title clas

http://blog.csdn.net/wangyibo0201/article/details/51705966

在數據挖掘方面，經常需要在做特征工程和模型訓練之前對數據進行清洗，剔除無效數據和異常數據。異常檢測也是數據挖掘的一個方向，用於反作弊、偽基站、金融詐騙等領域。
　　異常檢測方法，針對不同的數據形式，有不同的實現方法。常用的有基於分布的方法，在上、下α分位點之外的值認為是異常值（例如圖1），對於屬性值常用此類方法。基於距離的方法，適用於二維或高維坐標體系內異常點的判別，例如二維平面坐標或經緯度空間坐標下異常點識別，可用此類方法。
　　技術分享
　　這次要介紹一下一種基於距離的異常檢測算法，局部異常因子LOF算法（Local Outlier Factor）。

　　用視覺直觀的感受一下，如圖2，對於C1集合的點，整體間距，密度，分散情況較為均勻一致，可以認為是同一簇；對於C2集合的點，同樣可認為是一簇。o1、o2點相對孤立，可以認為是異常點或離散點。現在的問題是，如何實現算法的通用性，可以滿足C1和C2這種密度分散情況迥異的集合的異常點識別。LOF可以實現我們的目標。
　　技術分享

　　下面介紹LOF算法的相關定義：
　　1)

lrdk(p)=1/(∑o∈Nk(p)reach−distk(p,o)|Nk(p)|)

　　　　表示點p的第k鄰域內點到p的平均可達距離的倒數。
　　　　註意，是p的鄰域點

LOFk(p)=∑o∈Nk(p)lrdk(o)lrdk(p)|Nk(p)|=∑o∈Nk(p)lrdk(o)|Nk(p)|/lrdk(p)

異常點/離群點檢測算法——LOF

實現 div 剔除註意 out 兩種們的 title clas http://blog.csdn.net/wangyibo0201/article/details/51705966 在數據挖掘方面，經常需要在做特征工程和模型訓練之前對數據進行清洗，剔除無效數據和

異常點/離群點檢測算法——LOF

異常點/離群點檢測算法——LOF

異常點檢測算法小結

DAY 42 機器學習-風控-離群點檢測(異常檢測)

離群點（孤立點、異常值）檢測方法

離群點檢測與序列資料異常檢測以及異常檢測大殺器-iForest

R語言︱異常值檢驗、離群點分析、異常值處理

離群點檢測(Novelty Detection, Outlier Detenction)

基於正太分佈的一元離群點檢測

[資料探勘]離群點檢測---基於kNN的離群點檢測、LOF演算法和CLOF演算法

資料探勘中的離群點檢測

python 離群點檢測

資料探勘--離群點檢測

【資料探勘筆記十二】離群點檢測

資料分析第五篇：離群點檢測

異常檢測(Anomaly detection): 異常檢測算法（應用高斯分布）

[吳恩達機器學習筆記]15.1-3非監督學習異常檢測算法/高斯回回歸模型

離群點的檢驗

pcl點雲的離群點去除

Machine Learning 之 LOF離群點檢驗

離群點（oulier）挖掘詳解

異常點/離群點檢測算法——LOF

相關推薦