原型聚類演算法綜述（原型聚類演算法開篇）

阿新 • • 發佈：2019-02-08

原型聚類演算法綜述

第十六次寫部落格，本人數學基礎不是太好，如果有幸能得到讀者指正，感激不盡，希望能借此機會向大家學習。這一篇作為該類演算法族的開篇，主要介紹了基於原型聚類的最終模型和優化目標。

基於原型的聚類最終產生的模型包含以下兩部分：
(1) 聚類簇 $\{C_l|l=1,2,...,k\}$
(2) 聚類中心 $\{\mu_l|l=1,2,...,k\}$
最終得到的聚類模型，應儘量使得在同一個簇中的每個樣本點與該簇的聚類中心有較高的“相似度”，因此，根據簇有效性指標的不同，原型聚類的聚類目標可以表示為不同的優化函式，以下根據幾種重要的有效性指標，對迭代公式進行具體推導：

以SSE（誤差平方和）作為有效性指標

SSE有效性指標可以表示為：

優化目標為：

由於含有兩組目標變數，需要對其進行交替優化：
a) 當 $\{C_l|l=1,2,...,k\}$ 確定時
將式（1）對 $\mu_l$ 求偏導並置零，得到

由上式可知，這一步的優化需要將原聚類中心根據新得到的簇，替換為新的聚類中心；
b) 當 $\{\mu_l|l=1,2,...,k\}$ 確定時
為了減小總SSE，應該使得每個樣本重新分配到與其距離最近的聚類中心所代表的的簇中。

以SAE（絕對誤差和）作為有效性指標

SAE有效性指標可以表示為：

優化目標為：

由於含有兩組目標變數，需要對其進行交替優化：
a) 當 $\{C_l|l=1,2,...,k\}$ 確定時
將式（1）對求偏導並置零，得到

由上式可知，這一步的優化需要將原聚類中心根據新得到的簇，替換為新的聚類中位數；
b) 當 $\{\mu_l|l=1,2,...,k\}$ 確定時
為了減小總SSE，應該使得每個樣本重新分配到與其距離最近的聚類中心所代表的的簇中。

原型聚類演算法綜述（原型聚類演算法開篇）

原型聚類演算法綜述

以SSE（誤差平方和）作為有效性指標

以SAE（絕對誤差和）作為有效性指標

原型聚類演算法綜述（原型聚類演算法開篇）

聚類及相關演算法二（原型聚類、密度聚類、層次聚類）

基於圖的聚類演算法綜述（基於圖的聚類演算法開篇）

可伸縮聚類演算法綜述（可伸縮聚類演算法開篇）

基於深度學習的目標檢測演算法綜述（一）（截止20180821）

基於深度學習的目標檢測演算法綜述（三）（截止20180821）

基於深度學習的目標檢測演算法綜述（二）（截止20180821）

基於深度學習的目標檢測演算法綜述（一）

基於深度學習的目標檢測演算法綜述（二）

ICP演算法綜述（一）

基於深度學習的影象語義分割演算法綜述（截止20180715）

基於深度學習的目標檢測演算法綜述（三）

基於深度學習的目標檢測演算法綜述（二）—Two/One stage演算法改進之R-FCN

深度學習綜述（LeCun、Bengio和Hinton）

演算法作業（最短路+記錄全部路徑）

Python 資料結構與演算法——列表（連結串列，linked list）

少說話多寫程式碼之Python學習047——類的成員（呼叫父類建構函式）

一階RC濾波器的演算法實現（低通和高通）3102

演算法複習（找出重複的字元）

神經網路優化演算法一（梯度下降、學習率設定）

原型聚類演算法綜述（原型聚類演算法開篇）

原型聚類演算法綜述

以SSE（誤差平方和）作為有效性指標

以SAE（絕對誤差和）作為有效性指標

相關推薦