1. 程式人生 > >高斯混合模型聚類演算法和K-Means聚類演算法

高斯混合模型聚類演算法和K-Means聚類演算法

高斯混合模型聚類演算法

  • 概念:混合高斯模型就是指對樣本的概率密度分佈進行估計,而估計的模型是幾個高斯模型加權之和(具體是幾個要在模型訓練前建立好)。每個高斯模型就代表了一個類(一個Cluster)。對樣本中的資料分別在幾個高斯模型上投影,就會分別得到在各個類上的概率。然後我們可以選取概率最大的類所為判決結果。

  • 優點:

  • 優點:應用最為廣泛;收斂速度快;能擴充套件以用於大規模的資料集

  • 缺點:傾向於識別凸形分佈、大小相近、密度相近的聚類;中心選擇和噪聲聚類對結果影響大