1. 程式人生 > >原型聚類演算法綜述(原型聚類演算法開篇)

原型聚類演算法綜述(原型聚類演算法開篇)

原型聚類演算法綜述

第十六次寫部落格,本人數學基礎不是太好,如果有幸能得到讀者指正,感激不盡,希望能借此機會向大家學習。這一篇作為該類演算法族的開篇,主要介紹了基於原型聚類的最終模型和優化目標。

  基於原型的聚類最終產生的模型包含以下兩部分:
  (1) 聚類簇{Cll=1,2,...,k}\{C_l|l=1,2,...,k\}
  (2) 聚類中心{μll=1,2,...,k}\{\mu_l|l=1,2,...,k\}
  最終得到的聚類模型,應儘量使得在同一個簇中的每個樣本點與該簇的聚類中心有較高的“相似度”,因此,根據簇有效性指標的不同,原型聚類的聚類目標可以表示為不同的優化函式,以下根據幾種重要的有效性指標,對迭代公式進行具體推導:

以SSE(誤差平方和)作為有效性指標

  SSE有效性指標可以表示為:

  優化目標為:

  由於含有兩組目標變數,需要對其進行交替優化:
  a) 當{Cll=1,2,...,k}\{C_l|l=1,2,...,k\}確定時
   將式(1)對μl\mu_l求偏導並置零,得到

  由上式可知,這一步的優化需要將原聚類中心根據新得到的簇,替換為新的聚類中心;
  b) 當{μll=1,2,...,k}\{\mu_l|l=1,2,...,k\}確定時
   為了減小總SSE,應該使得每個樣本重新分配到與其距離最近的聚類中心所代表的的簇中。

以SAE(絕對誤差和)作為有效性指標

  SAE有效性指標可以表示為:

  優化目標為:

  由於含有兩組目標變數,需要對其進行交替優化:
  a) 當{Cll=1,2,...,k}\{C_l|l=1,2,...,k\}確定時
   將式(1)對求偏導並置零,得到

  由上式可知,這一步的優化需要將原聚類中心根據新得到的簇,替換為新的聚類中位數;
  b) 當{μll=1,2,...,k}\{\mu_l|l=1,2,...,k\}確定時
   為了減小總SSE,應該使得每個樣本重新分配到與其距離最近的聚類中心所代表的的簇中。