1. 程式人生 > >K-Means聚類算法原理

K-Means聚類算法原理

容易 cnblogs 技術分享 原理 display 叠代 style https lock

來自:https://www.cnblogs.com/pinard/p/6164214.html

  K-Means算法是無監督聚類算法,它有很多變體。包括初始化優化K-Means++,距離計算優化elkan K-Means算法和大樣本優化Mini Batch K-Means算法。

1. K-Means原理

  K-Means算法思想:給定樣本集,按照樣本之間距離大小,將樣本劃分為K個簇。讓簇的點盡量緊密連在一起,讓簇間的距離盡量的大。

  用數據表達式表示,簇劃分為(C1,C2,...Ck),目標是最小化平方誤差E:

技術分享圖片

  其中μi是簇Ci的均值向量,有時也質心,表達式:

技術分享圖片

  直接求上式最小值,不容易,是NP難題,只能采用啟發式的叠代算法。

  K-Means采用的啟發式方式很簡單,

K-Means聚類算法原理