1. 程式人生 > >Mean Shift 聚類

Mean Shift 聚類

演算法原理

Mean shift 演算法是基於核密度估計的爬山演算法,可用於聚類、影象分割等。
在這裡插入圖片描述
樣本點集:上圖中的實心點,n個樣本點yi,i=1,2,…,n
區域圓心:藍色空心圓x
感興趣區域Sh:藍色圓形區域,以x為圓心,h為半徑的圓形內部。表示式為
在這裡插入圖片描述
Mean Shift向量:從藍色空心圓到黃色空心圓的偏移向量,表示式為
在這裡插入圖片描述
三維高斯核概率密度分佈如下圖所示
在這裡插入圖片描述
高斯核密度分佈等高線圖如下圖所示
在這裡插入圖片描述
Mean Shift聚類的過程相當於爬山的過程,所有點都爬向最近的山頂,即等高線的中心,如下圖所示
在這裡插入圖片描述
聚類中心的更新沿著概率密度梯度方向,更新後的中心位置為
在這裡插入圖片描述

演算法的優缺點

優點:


不需要給出類別個數,類別個數取決於資料分佈
頻寬的選擇可以基於領域知識
缺點:
方法複雜度較高,O(N^2),不適合大規模資料集

寫部落格的目的是學習的總結和知識的共享,如有侵權,請與我聯絡,我將盡快處理
參考連結如下
https://blog.csdn.net/hjimce/article/details/45718593
https://spin.atomicobject.com/2015/05/26/mean-shift-clustering/
https://blog.csdn.net/liangzuojiayi/article/details/78152180
https://blog.csdn.net/unixtch/article/details/78556499