EM聚類演算法matlab實現

阿新 • • 發佈：2019-01-03

最近看到了樸素貝葉斯定理，看著看著就看到了em聚類的演算法中（K-means聚類的原型）。

動手自己編個程式：

%EM algorithm
clc;
clear;

sigma = 1.5;
miu1 = 3;
miu2 = 7;
N = 1000;
x = zeros(1,N);
for i = 1:N
    if rand>0.5
        x(1,i) = randn*sigma + miu1;
        y(1,i) = randn*sigma + miu1;
    else 
        %sigma = 0.5;
        x(1,i) = randn*sigma + miu2;
        y(1,i) = randn*sigma + miu2;
    end
end

plot(x,y,'o');

k = 2;
%miu = rand(1,k)*40;
miu(1) = 4;
miu(2) = 6;
cov(1) = 2;
cov(2) = 2;
%cov = rand(1,k)*6;
a(1) = 1.5;
a(2) = 1.5;
% expectations = zeros(N,k);
num = [0,0];
n = 1;
for step = 1:10000
    n = 1;
    m = 1;
    x1 = [];
    y1 = [];
    x2 = [];
    y2 = [];
    num = [1 1];
    for i = 1:N
        p1 = exp(-(x(i)-miu(1))*(x(i)-miu(1))/(2*cov(1)*cov(1)))/sqrt((2*pi))*cov(1);
        p2 = exp(-(x(i)-miu(2))*(x(i)-miu(2))/(2*cov(2)*cov(2)))/sqrt((2*pi))*cov(2);
        
        p(i) = a(1)*p1+a(2)*p2;
        if p1>p2
            x1(n) = x(i);
            y1(n) = y(i);
            n = n+1;
            num(1) = num(1) + 1;
        else
            x2(m) = x(i);
            y2(m) = y(i);
            m = m+1;
            num(2) = num(2) + 1;
        end
    end
        
        oldmiu = miu;
        oldcov = cov;
        miu(1) = sum(x1)/num(1);
        miu(2) = sum(x2)/num(2);
        cov(1) = sqrt(sum((x1-miu(1))*(x1-miu(1))')/num(1));
        cov(2) = sqrt(sum((x2-miu(2))*(x2-miu(2))')/num(2));
        a(1) = num(1)/N;
        a(2) = num(2)/N;
        
    plot(x1,y1,'ro',x2,y2,'go');
    epsilon = 0.0001;
    if sum(abs(oldmiu-miu))<epsilon
        break;
    end
    step
%     miu
end
plot(x1,y1,'ro',x2,y2,'go');

執行後的結果圖如下：

不知道是我自己編的不對，還是別的原因（應該是我編的不對），在初始化引數的時候，不能跟實際的偏離太大，如果偏離太大了

最終的結果就完全不對。不知道是演算法本身的缺陷還是自己沒有把演算法理解對。

希望有高手來指導下。

EM聚類演算法matlab實現

最近看到了樸素貝葉斯定理，看著看著就看到了em聚類的演算法中（K-means聚類的原型）。動手自己編個程式： %EM algorithm clc; clear; sigma = 1.5; miu1 = 3; miu2 = 7; N = 1000; x = zeros(1

譜聚類演算法Matlab快速實現

%Ncut譜聚類完整函式定義（儲存為.m檔案）： function C = SpectralClustering(data,k,a) %data是資料點矩陣 K是聚類個數 a代表高斯核函式的引數 %UNTITLED Summary of this functio

K-menas聚類演算法C++實現

基本介紹： k-means 演算法接受輸入量 k ；然後將n個數據物件劃分為 k個聚類以便使得所獲得的聚類滿足：同一聚類中的物件相似度較高；而不同聚類中的物件相似度較小。聚類相似度是利用各聚類中物件的均值所獲得一個“中心物件”（引力中心）來進行計算的。工作過程：　　k-m

模糊C均值聚類演算法及實現

模糊C均值聚類演算法的實現研究背景 https://blog.csdn.net/liu_xiao_cheng/article/details/50471981 聚類分析是多元統計分析的一種，也是無監督模式識別的一個重要分支，在模式分類影象處理和模糊

K-modes聚類演算法MATLAB

K-modes演算法主要用於分類資料，如國籍，性別等特徵。距離使用漢明距離，即有多少對應特徵不同則距離為幾。中心點計算為，選擇眾數作為中心點。主要功能：隨機初始化聚類中心，計算聚類。選擇每次聚類次數，選擇最佳聚類初始化。 kmodes.m程式碼 function [cx,cos

K-medodis聚類演算法MATLAB

國內部落格，上介紹實現的K-medodis方法為：與K-means演算法類似。只是距離選擇與聚類中心選擇不同。距離為曼哈頓距離聚類中心選擇為：依次把一個聚類中的每一個點當作當前類的聚類中心，求出代價值最小的點當作當前聚類中心。維基百科上，實現的方法為PAM演算法。分成K類，把每個點都嘗試當

k-medoid(k中心點)聚類演算法Python實現

k-means演算法有個很大的缺點，就是對孤立點敏感性太高，孤立點即是脫離群眾的點，與眾不同的點，即在顯示中與其他點不是抱在一團的點。為了體現兩者的不同，我特意溫習了一下知識，在構造初始點的時候，自己定義加入了幾個孤立點，使用k-means演算法跑的效果如下：一開始的所有點：（可以看出其

層次聚類演算法java實現

public class Node { String nodeName; // 樣本點名 Cluster cluster; // 樣本點所屬類簇 private double dimension[]; // 樣本點的維度 public Node(){ } publ

聚類演算法——python實現SOM演算法

演算法簡介 SOM網路是一種競爭學習型的無監督神經網路，將高維空間中相似的樣本點對映到網路輸出層中的鄰近神經元。訓練過程簡述：在接收到訓練樣本後，每個輸出層神經元會計算該樣本與自身攜帶的權向量之間的距離，距離最近的神經元成為競爭獲勝者，稱為最佳匹配單元。然

K-means和PAM聚類演算法Python實現及對比

K-means（K均值劃分）聚類：簡單的說，一般流程如下：先隨機選取k個點，將每個點分配給它們，得到最初的k個分類；在每個分類中計算均值，將點重新分配，劃歸到最近的中心點；重複上述步驟直到點的劃歸不再改變。下圖是K-means方法的示意。 PAM

淺談AP聚類演算法-matlab

AP(Affinity Propagation)演算法,稱為仿射傳播聚類演算法、近鄰傳播聚類演算法、親和傳播聚類演算法，是根據資料點之間的相似度來進行聚類，可以是對稱的，也可以是不對稱的。該演算法不需要先確定聚類的數目，而是把所有的資料點都看成潛在意義上的聚類中心（ex

K-means 聚類演算法MATLAB程式碼

%----------------------main function----------------------------- %% Clear Memory & Command Window clc clear close all %% Generate Po

DBSCAN聚類演算法的實現

設有N個樣本，樣本為p維，（1）計算距離矩陣D，時間複雜度為O(N*N*p)；（2）對距離矩陣的每一行進行從小到大排序，得到SD（sorted D），時間複雜度為O(N*N*log(N)); （3）根據Eps與MinPts，標註核心點、邊界點和噪聲點。首先比較SD（：

NLP——Kmeans聚類演算法簡單實現

本例中主要是對二維點進行距離計算，開始得時候選取兩個心，最終聚為兩簇。結束條件的判斷有很多種，這裡採用的是最簡單的：當兩個心不再變化了，則停止聚類。內部距離和可以不需要計算，這裡輸出來做結果評估用。 public class Km_w2 { //初始

Crawler/ML：爬蟲技術(基於urllib.request庫從網頁獲取圖片)+HierarchicalClustering層次聚類演算法，實現自動從網頁獲取圖片然後根據圖片色調自動分類

網上教程太囉嗦，本人最討厭一大堆沒用的廢話，直接上，就是幹！網路爬蟲？非監督學習？只有兩步，只有兩個步驟？ Are you kidding me？ Are you ok? 來吧，follow me, come on! 一、爬蟲下載圖片第一步：首先，我們從網

python K-Means聚類演算法的實現

K-Means 簡介聚類演算法有很多種（幾十種），K-Means是聚類演算法中的最常用的一種，演算法最大的特點是簡單，好理解，運算速度快，但是一定要在聚類前需要手工指定要分成幾類。具體實現步驟如下：給定n個訓練樣本{x1，x2，x3，…，xn} 　

DBScan聚類演算法Java實現

DBScan演算法流程圖演算法：DBScan，基於密度的聚類演算法輸入： D：一個包含n個數據的資料集 r：半徑引數 minPts：領域密度閾值輸出：基於密度的聚類集合標記D中所有的點為unvisted for each p i

DBSCAN聚類演算法C++實現

1 #include "ClusterAnalysis.h" 2 #include <fstream> 3 #include <iosfwd> 4 #include <math.h> 5 6 /* 7 函式：聚類初始化操作 8 說明：將資

譜聚類演算法 matlab

1、譜聚類演算法步驟公式（1）整理資料集，使資料集中資料在0-1之間。假設資料集m行n列。（2）求鄰接矩陣W。元素值為每一點到其他點之間距離，即權重。（3）求相似度矩陣S，相似度矩陣的定義。相似度矩陣由權值矩陣得到，實踐中一般用高斯核函式（也稱徑向基

層次聚類演算法及其實現

層次聚類演算法分為合併演算法和分裂演算法。合併演算法會在每一步減少聚類中心的數量，聚類產生的結果來自前一步的兩個聚類的合併；分裂演算法與合併演算法原理相反，在每一步增加聚類的數量，每一步聚類產生的

EM聚類演算法matlab實現

相關推薦