1. 程式人生 > >k-均值 聚類演算法

k-均值 聚類演算法

  首先初始化k個點作為質心,遍歷資料集,把每一個數據點分配到距離最近的質心,把這個質心下的所有點的均值作為新的質心,迭代更新。

  度量聚類效果的指標:SSE( sum of squared error)誤差平方和
改進演算法:二分-k-均值演算法(克服k-均值區域性收斂)

二分-k-均值 聚類演算法  
  將所有點看成一個簇,利用2均值聚類將簇一分為二,選擇SSE最大的簇進行劃分,直到達到使用者指定的分類數。