k-means演算法實際應用的一個例子

阿新 • • 發佈：2019-01-15

下面引用

原創地址：

1、從D中隨機取k個元素，作為k個簇的各自的中心。

2、分別計算剩下的元素到k個簇中心的相異度，將這些元素分別劃歸到相異度最低的簇。

3、根據聚類結果，重新計算k個簇各自的中心，計算方法是取簇中所有元素各自維度的算術平均數。

4、將D中全部元素按照新的中心重新聚類。

5、重複第4步，直到聚類結果不再變化。

6、將結果輸出。

由於演算法比較直觀，沒有什麼可以過多講解的。下面，我們來看看k-means演算法一個有趣的應用示例：中國男足近幾年到底在亞洲處於幾流水平？

今年中國男足可算是杯具到家了，幾乎到了過街老鼠人人喊打的地步。對於目前中國男足在亞洲的地位，各方也是各執一詞，有人說中國男足亞洲二流，有人說三流，還有人說根本不入流，更有人說其實不比日韓差多少，是亞洲一流。既然爭論不能解決問題，我們就讓資料告訴我們結果吧。

下圖是我採集的亞洲15只球隊在2005年-2010年間大型盃賽的戰績（由於澳大利亞是後來加入亞足聯的，所以這裡沒有收錄）。

其中包括兩次世界盃和一次亞洲盃。我提前對資料做了如下預處理：對於世界盃，進入決賽圈則取其最終排名，沒有進入決賽圈的，打入預選賽十強賽賦予40，預選賽小組未出線的賦予50。對於亞洲盃，前四名取其排名，八強賦予5，十六強賦予9，預選賽沒出現的賦予17。這樣做是為了使得所有資料變為標量，便於後續聚類。

下面先對資料進行[0,1]規格化，下面是規格化後的資料：

接著用k-means演算法進行聚類。設k=3，即將這15支球隊分成三個集團。

現抽取日本、巴林和泰國的值作為三個簇的種子，即初始化三個簇的中心為A：{0.3, 0, 0.19}，B：{0.7, 0.76, 0.5}和C：{1, 1, 0.5}。下面，計算所有球隊分別對三個中心點的相異度，這裡以歐氏距離度量。下面是我用程式求取的結果：

從做到右依次表示各支球隊到當前中心點的歐氏距離，將每支球隊分到最近的簇，可對各支球隊做如下聚類：

中國C，日本A，韓國A，伊朗A，沙特A，伊拉克C，卡達C，阿聯酋C，烏茲別克B，泰國C，越南C，阿曼C，巴林B，朝鮮B，印尼C。

第一次聚類結果：

A：日本，韓國，伊朗，沙特；

B：烏茲別克，巴林，朝鮮；

C：中國，伊拉克，卡達，阿聯酋，泰國，越南，阿曼，印尼。

下面根據第一次聚類結果，調整各個簇的中心點。

A簇的新中心點為：{(0.3+0+0.24+0.3)/4=0.21, (0+0.15+0.76+0.76)/4=0.4175, (0.19+0.13+0.25+0.06)/4=0.1575} = {0.21, 0.4175, 0.1575}

用同樣的方法計算得到B和C簇的新中心點分別為{0.7, 0.7333, 0.4167}，{1, 0.94, 0.40625}。

用調整後的中心點再次進行聚類，得到：

第二次迭代後的結果為：

中國C，日本A，韓國A，伊朗A，沙特A，伊拉克C，卡達C，阿聯酋C，烏茲別克B，泰國C，越南C，阿曼C，巴林B，朝鮮B，印尼C。

結果無變化，說明結果已收斂，於是給出最終聚類結果：

亞洲一流：日本，韓國，伊朗，沙特

亞洲二流：烏茲別克，巴林，朝鮮

亞洲三流：中國，伊拉克，卡達，阿聯酋，泰國，越南，阿曼，印尼

===================================================================完

k-means演算法實際應用的一個例子

k-means演算法實際應用的一個例子

k-means演算法實際應用

K-Means++演算法及應用

第九次作業---K-means演算法應用：圖片壓縮

K-means演算法應用：圖片壓縮

第九次作業——K-means演算法應用：圖片壓縮

作業：K-means演算法應用：圖片壓縮

【原創】資料探勘案例——ReliefF和K-means演算法的醫學應用

K-means演算法原理以及應用（R）

聚類演算法—K-Means原理與應用

8.2 聚類(Clustering) K-means演算法應用

分組聚集的K-means演算法應用例項

Spark K-Means 演算法例子

基於改進的K-means演算法在共享交通行業客戶細分中的應用

機器學習——K-means演算法（聚類演算法）

K-means算法應用：圖片壓縮

吳恩達機器學習 - 無監督學習——K-means演算法吳恩達機器學習 - 無監督學習——K-means演算法

機器學習--K-means演算法

K-means演算法的matlab程式 K-means演算法的matlab程式（初步）

學習筆記（十一）：使用K-Means演算法檢測DGA域名

k-means演算法實際應用的一個例子

相關推薦