1. 程式人生 > >機器學習第十二課(距離,K-means,聚類衡量指標)

機器學習第十二課(距離,K-means,聚類衡量指標)

各種距離:




K-MEANS





Kmeans演算法的缺陷

  • 聚類中心的個數K 需要事先給定,但在實際中這個 K 值的選定是非常難以估計的,很多時候,事先並不知道給定的資料集應該分成多少個類別才最合適
  • Kmeans需要人為地確定初始聚類中心,不同的初始聚類中心可能導致完全不同的聚類結果。(可以使用Kmeans++演算法來解決)


聚類的衡量指標: