聚類演算法(二)
阿新 • • 發佈:2018-12-08
密度聚類
密度聚類假設聚類結構能通過樣本分佈的緊密程度確定,通常情況下密度聚類演算法從樣本密度的角度來考察樣本之間的可連線性,並基於可連線樣本不斷擴充套件聚類 簇以獲得最終的聚類結果
DBSCAN
- 基於一組鄰域引數來刻畫樣本分佈的緊密程度。
- 事先不用預設聚類簇數
https://blog.csdn.net/xiaokang123456kao/article/details/74978572
層次聚類
在不同層次對資料進行劃分,從而形成樹形聚類結構
- 自底向上
- 自頂向下
AGNES
- 一種採用自底向上聚合策略的層次聚類演算法。先將資料集中的每個樣本看作一個初始聚類簇,然後在演算法執行的每一步中國找出距離最近的兩個聚類簇進行合併,該過程不斷重複,直至達到預設的聚類簇個數。
- 計算聚類簇間的距離,可以看作計算集合間的距離,採用豪斯多夫距離
- 需要預先設定聚類簇數
參考下面部落格
https://blog.csdn.net/qq_39388410/article/details/78240037
https://blog.csdn.net/u012500237/article/details/65437525
聚類演算法的應用:
- 聚類整合:通過對多個聚類學習器進行整合,有效降低聚類假設與真實結構不符,聚類過程中的隨機性等因素帶來的不利影響。
- 異常檢測:藉助聚類或距離計算進行,如將遠離所有簇中心的樣本作為異常點,或將密度極低處的樣本作為異常點。