K-medodis聚類演算法MATLAB

阿新 • • 發佈：2018-12-23

國內部落格，上介紹實現的K-medodis方法為：

與K-means演算法類似。只是距離選擇與聚類中心選擇不同。

距離為曼哈頓距離

聚類中心選擇為：依次把一個聚類中的每一個點當作當前類的聚類中心，求出代價值最小的點當作當前聚類中心。

維基百科上，實現的方法為PAM演算法。

分成K類，把每個點都嘗試當作聚類中心，並求出當前組合聚類中心點組合的代價值。找到總最小代價值的中心點。

國內實現：

kMedoids.m程式碼：

function [cx,cost] = kMedoids(K,data,num)
%   生成將data聚成K類的最佳聚類
%   K為聚類數目，data為資料集,num為隨機初始化次數
    [cx,cost]  
= kMedoids1(K,data);
    for i = 2:num
        [cx1,min] = kMedoids1(K,data);
        if min<cost
            cost = min;
            cx = cx1;
        end
    end
end

function [cx,cost] = kMedoids1(K,data)
%   把分類資料集data聚成K類
%   [cx,cost] = kmeans(K,data)
%   K為聚類數目，data為資料集
%   cx為樣本所屬聚類，cost為此聚類的代價值
 
% 選擇需要聚類的數目

% 隨機選擇聚類中心
    centroids = data(randperm(size(data,1),K),:);
% 迭代聚類 
    centroids_temp = zeros(size(centroids));
    num = 0;
    while (~isequal(centroids_temp,centroids)&&num<20) 
        centroids_temp = centroids;
        [cx,cost] = findClosest(data,centroids,K);
        centroids  
= compueCentroids(data,cx,K);
        num = num+1;
    end
%     cost = cost/size(data,1);

end


function [cx,cost] = findClosest(data,centroids,K)
% 將樣本劃分到最近的聚類中心
    cost = 0;
    n = size(data,1);
    cx = zeros(n,1);
    for i = 1:n
%       曼哈頓距離
        [M,I] = min(sum(abs((data(i,:)-centroids))'));
        cx(i) = I;
        cost = cost+M;
    end
end


function centroids = compueCentroids(data,cx,K)
% 計算新的聚類中心
    centroids = zeros(K,size(data,2));
    for i = 1:K
%       尋找代價值最小的當前聚類中心
        temp = data((cx==i),:);
        [~,I] = min(sum(squareform(pdist(temp))));
        centroids(i,:) = temp(I,:);
    end
end

Main.m

% 主函式

% 生成符合高斯分佈的資料
mu = [5,5];
sigma = [16,0;0,16];
sigma1 = [0.5,0;0,0.5];
data =  gaussianSample(8,50,mu,sigma,sigma1);

% 聚類
K = 6;
[cx,cost] = kMedoids(K,data,10);
plotMedoids(data,cx,K);

執行Main.m結果為：

K-medodis聚類演算法MATLAB

國內部落格，上介紹實現的K-medodis方法為：與K-means演算法類似。只是距離選擇與聚類中心選擇不同。距離為曼哈頓距離聚類中心選擇為：依次把一個聚類中的每一個點當作當前類的聚類中心，求出代價值最小的點當作當前聚類中心。維基百科上，實現的方法為PAM演算法。分成K類，把每個點都嘗試當

K-modes聚類演算法MATLAB

K-modes演算法主要用於分類資料，如國籍，性別等特徵。距離使用漢明距離，即有多少對應特徵不同則距離為幾。中心點計算為，選擇眾數作為中心點。主要功能：隨機初始化聚類中心，計算聚類。選擇每次聚類次數，選擇最佳聚類初始化。 kmodes.m程式碼 function [cx,cos

K-means 聚類演算法MATLAB程式碼

%----------------------main function----------------------------- %% Clear Memory & Command Window clc clear close all %% Generate Po

MatLab建模學習筆記14——K-Means聚類演算法

網際網路的發展帶動雲端計算、虛擬化、大資料等IT新技術的興起，各行各業的網際網路化日趨明顯。其中大資料的興起和發展壯大成為了IT時代或者說資訊時代最為典型的特徵之一。僅就大資料本身而言，其本身就具有資料體積大、資料多樣性、價值密度低、資料更新快等特點。所以，要想

K均值聚類演算法的MATLAB實現

單來說，K-均值聚類就是在給定了一組樣本(x1, x2, ...xn) （xi, i = 1, 2, ... n均是向量) 之後，假設要將其聚為 m(<n) 類，可以按照如下的步驟實現: Step 1: 從 (x1, x2, ...xn) 中隨機選擇

如何編寫求K-均值聚類演算法的Matlab程式？

在聚類分析中，K-均值聚類演算法（k-means algorithm）是無監督分類中的一種基本方法，其也稱為C-均值演算法，其基本思想是：通過迭代的方法，逐次更新各聚類中心的值，直至得到最好的聚類結果。假設要把樣本集分為c個類別，演算法如下：（1）適當選擇c個類的初始中心；（2）在第k次迭代中，對任意

K-means聚類演算法及其MATLAB實現

clear all;close all;clc; % 第一組資料 mu1=[0 0 ]; %均值 S1=[.1 0 ;0 .1]; %協方差 data1=mvnrnd(mu1,S1,100); %產生高斯分佈資料 %第二組資料 mu2=[1.25 1.25 ]; S2=[.1 0 ;0 .1]; da

matlab中k-means聚類演算法畫點

只是需要用到matlab畫圖，在網上隨便找了找改了改 matlab內部直接就有k-means的 X=[39.55 116.24;41.48 123.25;38.55 121.36;43.54 125.19;45.44 126.36;37.54 112.33;40.06 1

Matlab實現簡單K-means聚類演算法

K-means演算法簡要思想: 演算法接受引數 k ；然後將事先輸入的n個數據物件劃分為 k個聚類以便使得所獲得的聚類滿足：同一聚類中的物件相似度較高；而不同聚類中的物件相似度較小。（1）適當選擇k個類的初始中心；（2）在第k次迭代中，對任意一個樣本，求其

K-means聚類演算法的典型簡單應用（Matlab實現）

%matlab code % K-means Cluster %load data.dat %x,y的範圍為0~50，x_data是一個1行100列的行矩陣 x_data = 50*rand(1,100); y_data = 50*rand(1,100); % x_da

機器學習實戰（Machine Learning in Action）學習筆記————06.k-均值聚類演算法（kMeans）學習筆記

機器學習實戰（Machine Learning in Action）學習筆記————06.k-均值聚類演算法（kMeans）學習筆記關鍵字：k-均值、kMeans、聚類、非監督學習作者：米倉山下時間：2018-11-3機器學習實戰（Machine Learning in Action,@author: Pet

吳恩達老師機器學習筆記K-means聚類演算法（二）

運用K-means聚類演算法進行影象壓縮趁熱打鐵，修改之前的演算法來做第二個練習—影象壓縮原始圖片如下：程式碼如下： X =imread('bird.png'); % 讀取圖片 X =im2double(X); % unit8轉成double型別 [m,n,z]=size

吳恩達老師機器學習筆記K-means聚類演算法（一）

今天接著學習聚類演算法以後堅決要八點之前起床學習！不要浪費每一個早晨。 K-means聚類演算法聚類過程如下：原理基本就是先從樣本中隨機選擇聚類中心，計算樣本到聚類中心的距離，選擇樣本最近的中心作為該樣本的類別。最後某一類樣本的座標平均值作為新聚類中心的座標，如此往復。原

k-median聚類演算法【基本概念篇】

寫在前面的話難道最近這種文章看的人比較多，unbelievable! 因為覺得這些都是特別老的演算法，應該別人會不怎麼看的，但是沒想到，我覺得有意思的文章反倒是沒有人看，覺得就是很多東西不寫，想要回顧的時候自己的記憶又沒有自己認為的那麼牛逼，有些東西還是全面的理解透徹了，寫下來的話

使用Java實現K-Means聚類演算法

第一次寫部落格，隨便寫寫。關於K-Means介紹很多，還不清楚可以查一些相關資料。個人對其實現步驟簡單總結為4步: 1.選出k值,隨機出k個起始質心點。 2.分別計算每個點和k個起始質點之間的距離,就近歸類。 3.最終中心點集可以劃分為k類,

機器學習（十二）讓你輕鬆理解K-means 聚類演算法

前言你還記得菜市場賣菜的嗎？書店賣書的或者是平時去超市買東西時的物品，它們是不是都根據相似性擺放在一起了呢，飲料、啤酒、零食分佈在各自區域，像這樣各級事物的相似特點或特性組織在一起的方法，在機器學習裡面即成為

K-means聚類演算法原理簡單介紹

K-means演算法（1. 剛開始隨機選擇兩個點作為簇重心，然後計算每個資料點離這個重心的距離並把這些點歸為兩個類）（上一步的結果如下圖，所有離藍色叉近的點被標為藍色了，紅色亦然）

【機器學習】接地氣地解釋K-means聚類演算法

俗話說“物以類聚，人以群分”，這句話在K-means聚類演算法裡面得到了充分的繼承。而K-means演算法的實際應用範圍可謂是大到無法估量，基本可以說，只要你想不到，沒有聚類聚不起來的東西！ &nbs

在Ignite中使用k-均值聚類演算法

在本系列前面的文章中，簡單介紹了一下Ignite的k-最近鄰(k-NN)分類演算法，下面會嘗試另一個機器學習演算法，即使用泰坦尼克資料集介紹k-均值聚類演算法。正好，Kaggle提供了CSV格式的資料集，而要分析的是兩個分類：即乘客是否倖存。為了將資料轉換為Ignite支援的格式，前期需要做一些清理和格式化

吳恩達機器學習筆記八 K-means聚類演算法

1. 代價函式 K-means演算法是比較容易理解的，它屬於無監督學習方法，所以訓練樣本資料不再含有標籤。我們假設有樣本資料x(1),x(2),⋯,x(m)x(1),x(2),⋯,x(m)，我們選擇設定KK個聚類中心u1,u2,⋯,uKu1,u2,⋯,uK

K-medodis聚類演算法MATLAB

相關推薦