K-means演算法的matlab程式 K-means演算法的matlab程式（初步）

阿新 • • 發佈：2018-11-09

K-means演算法的matlab程式

在“K-means演算法的matlab程式（初步）”這篇文章中已經用matlab程式對iris資料庫進行簡單的實現，下面的程式最終的目的是求準確度。

作者：凱魯嘎吉 - 部落格園 http://www.cnblogs.com/kailugaji/

1.採用iris資料庫

iris_data.txt

5.1    3.5    1.4    0.2
4.9    3    1.4    0.2
4.7    3.2    1.3    0.2
4.6    3.1    1.5    0.2
5    3.6    1.4    0.2 

5.4    3.9    1.7    0.4
4.6    3.4    1.4    0.3
5    3.4    1.5    0.2
4.4    2.9    1.4    0.2
4.9    3.1    1.5    0.1
5.4    3.7    1.5    0.2
4.8    3.4    1.6    0.2
4.8    3    1.4    0.1
4.3    3    1.1    0.1
5.8    4    1.2    0.2
5.7    4.4    1.5    0.4
5.4    3.9    1.3    0.4
5.1    3.5    1.4    0.3 

5.7    3.8    1.7    0.3
5.1    3.8    1.5    0.3
5.4    3.4    1.7    0.2
5.1    3.7    1.5    0.4
4.6    3.6    1    0.2
5.1    3.3    1.7    0.5
4.8    3.4    1.9    0.2
5    3    1.6    0.2
5    3.4    1.6    0.4
5.2    3.5    1.5    0.2
5.2    3.4    1.4    0.2
4.7    3.2    1.6    0.2
4.8    3.1    1.6    0.2 

5.4    3.4    1.5    0.4
5.2    4.1    1.5    0.1
5.5    4.2    1.4    0.2
4.9    3.1    1.5    0.2
5    3.2    1.2    0.2
5.5    3.5    1.3    0.2
4.9    3.6    1.4    0.1
4.4    3    1.3    0.2
5.1    3.4    1.5    0.2
5    3.5    1.3    0.3
4.5    2.3    1.3    0.3
4.4    3.2    1.3    0.2
5    3.5    1.6    0.6
5.1    3.8    1.9    0.4
4.8    3    1.4    0.3
5.1    3.8    1.6    0.2
4.6    3.2    1.4    0.2
5.3    3.7    1.5    0.2
5    3.3    1.4    0.2
7    3.2    4.7    1.4
6.4    3.2    4.5    1.5
6.9    3.1    4.9    1.5
5.5    2.3    4    1.3
6.5    2.8    4.6    1.5
5.7    2.8    4.5    1.3
6.3    3.3    4.7    1.6
4.9    2.4    3.3    1
6.6    2.9    4.6    1.3
5.2    2.7    3.9    1.4
5    2    3.5    1
5.9    3    4.2    1.5
6    2.2    4    1
6.1    2.9    4.7    1.4
5.6    2.9    3.6    1.3
6.7    3.1    4.4    1.4
5.6    3    4.5    1.5
5.8    2.7    4.1    1
6.2    2.2    4.5    1.5
5.6    2.5    3.9    1.1
5.9    3.2    4.8    1.8
6.1    2.8    4    1.3
6.3    2.5    4.9    1.5
6.1    2.8    4.7    1.2
6.4    2.9    4.3    1.3
6.6    3    4.4    1.4
6.8    2.8    4.8    1.4
6.7    3    5    1.7
6    2.9    4.5    1.5
5.7    2.6    3.5    1
5.5    2.4    3.8    1.1
5.5    2.4    3.7    1
5.8    2.7    3.9    1.2
6    2.7    5.1    1.6
5.4    3    4.5    1.5
6    3.4    4.5    1.6
6.7    3.1    4.7    1.5
6.3    2.3    4.4    1.3
5.6    3    4.1    1.3
5.5    2.5    4    1.3
5.5    2.6    4.4    1.2
6.1    3    4.6    1.4
5.8    2.6    4    1.2
5    2.3    3.3    1
5.6    2.7    4.2    1.3
5.7    3    4.2    1.2
5.7    2.9    4.2    1.3
6.2    2.9    4.3    1.3
5.1    2.5    3    1.1
5.7    2.8    4.1    1.3
6.3    3.3    6    2.5
5.8    2.7    5.1    1.9
7.1    3    5.9    2.1
6.3    2.9    5.6    1.8
6.5    3    5.8    2.2
7.6    3    6.6    2.1
4.9    2.5    4.5    1.7
7.3    2.9    6.3    1.8
6.7    2.5    5.8    1.8
7.2    3.6    6.1    2.5
6.5    3.2    5.1    2
6.4    2.7    5.3    1.9
6.8    3    5.5    2.1
5.7    2.5    5    2
5.8    2.8    5.1    2.4
6.4    3.2    5.3    2.3
6.5    3    5.5    1.8
7.7    3.8    6.7    2.2
7.7    2.6    6.9    2.3
6    2.2    5    1.5
6.9    3.2    5.7    2.3
5.6    2.8    4.9    2
7.7    2.8    6.7    2
6.3    2.7    4.9    1.8
6.7    3.3    5.7    2.1
7.2    3.2    6    1.8
6.2    2.8    4.8    1.8
6.1    3    4.9    1.8
6.4    2.8    5.6    2.1
7.2    3    5.8    1.6
7.4    2.8    6.1    1.9
7.9    3.8    6.4    2
6.4    2.8    5.6    2.2
6.3    2.8    5.1    1.5
6.1    2.6    5.6    1.4
7.7    3    6.1    2.3
6.3    3.4    5.6    2.4
6.4    3.1    5.5    1.8
6    3    4.8    1.8
6.9    3.1    5.4    2.1
6.7    3.1    5.6    2.4
6.9    3.1    5.1    2.3
5.8    2.7    5.1    1.9
6.8    3.2    5.9    2.3
6.7    3.3    5.7    2.5
6.7    3    5.2    2.3
6.3    2.5    5    1.9
6.5    3    5.2    2
6.2    3.4    5.4    2.3
5.9    3    5.1    1.8

View Code

iris_id.txt

View Code

2.matlab源程式：

My_Kmeans.m

function label_1=My_Kmeans(K)
%輸入K：聚類數
%輸出：label_1:聚的類, para_miu_new:聚類中心μ
format long
eps=1e-15;  %定義迭代終止條件的eps
data=dlmread('E:\www.cnblogs.comkailugaji\data\iris\iris_data.txt');
%----------------------------------------------------------------------------------------------------
%對data做最大-最小歸一化處理
[data_num,data_dim]=size(data);
X=zeros(data_num,data_dim);
data_min=min(min(data));
data_max=max(max(data));
for j=1:data_dim
    for i=1:data_num
        X(i,j)=(data(i,j)-data_min)/(data_max-data_min);
    end
end
[X_num,~]=size(X);
%----------------------------------------------------------------------------------------------------
%隨機初始化K個聚類中心
rand_array=randperm(X_num);  %產生1~X_num之間整數的隨機排列
para_miu_new=X(rand_array(1:K),:);  %隨機排列取前K個數，在X矩陣中取這K行作為初始聚類中心
responsivity=zeros(X_num,K);
%----------------------------------------------------------------------------------------------------
%K-means演算法
while true
    para_miu=para_miu_new;  %上一步的聚類中心
    %歐氏距離，計算（X-para_miu）^2=X^2+para_miu^2-2*X*para_miu'，矩陣大小為X_num*K
    distant=repmat(sum(X.*X,2),1,K)+repmat(sum(para_miu.*para_miu,2)',X_num,1)-2*X*para_miu';
    %返回distant每行最小值所在的下標
    [~,label_1]=min(distant,[],2);
    %構建隸屬度矩陣X_num*K
    for i=1:X_num
        for j=1:K
            responsivity(i,j)=isequal(j,label_1(i));
        end
    end
    R_k=sum(responsivity,1);  %分母,第k類的個數,1*k的矩陣
    para_miu_new=diag(1./R_k)*responsivity'*X;  %更新引數miu(聚類中心)
    if norm(para_miu_new-para_miu)<=eps
        break;
    end
end

succeed.m

function accuracy=succeed(K,id)
%輸入K：聚的類，id：訓練後的聚類結果，N*1的矩陣
N=size(id,1);   %樣本個數
p=perms(1:K);   %全排列矩陣
p_col=size(p,1);   %全排列的行數
new_label=zeros(N,p_col);   %聚類結果的所有可能取值，N*p_col
num=zeros(1,p_col);  %與真實聚類結果一樣的個數
real_label=dlmread('E:\www.cnblogs.comkailugaji\data\iris\iris_id.txt');
%將訓練結果全排列為N*p_col的矩陣，每一列為一種可能性
for i=1:N
    for j=1:p_col
        for k=1:K
            if id(i)==k
                new_label(i,j)=p(j,k)-1;
            end
        end
    end
end
%與真實結果比對，計算精確度
for j=1:p_col
    for i=1:N
        if new_label(i,j)==real_label(i)
                num(j)=num(j)+1;
        end
    end
end
accuracy=max(num)/N;

Eg_Kmeans.m

function ave_acc_kmeans=Eg_Kmeans(K,max_iter)
%輸入K:聚的類，max_iter是最大迭代次數
%輸出ave_acc_kmeans：迭代max_iter次之後的平均準確度
s=0;
for i=1:max_iter
    label_1=My_Kmeans(K);
    accuracy=succeed(K,label_1);
    s=s+accuracy;
end
ave_acc_kmeans=s/max_iter;

3.結果

>> ave_acc_kmeans=Eg_Kmeans(3,50)
ave_acc_kmeans =
   0.826133333333333

K-means演算法的matlab程式 K-means演算法的matlab程式（初步）

K-means演算法的matlab程式在“K-means演算法的matlab程式（初步）”這篇文章中已經用matlab程式對iris資料庫進行簡單的實現，下面的程式最終的目的是求準確度。作者：凱魯嘎吉 - 部落格園 http://www.cnblogs.com/kailugaji/ 1.採

程式設計師之網路安全系列（二）：如何安全儲存使用者密碼及雜湊演算法

系列目錄: 前言在很多網站的早期，甚至是現在仍然有一些網站，當你點選忘記密碼功能時，你的郵箱會收到一封郵件，然後裡面赫然寫著你的密碼，很多普通使用者還會覺得慶幸，總算是找回來了，殊不知，這是多麼可怕地一件事，說明了網站是“幾乎是”明文儲存你的密碼，一旦資料使用者資料洩露或者被拖庫，那麼使用者密碼將赤裸裸

程式設計師之網路安全系列（三）：資料加密之對稱加密演算法

系列目錄: 前文回顧假如，明明和麗麗相互不認識，明明想給麗麗寫一封情書，讓隔壁老王送去如何保證隔壁老王不能看到情書內容？（保密性) 如何保證隔壁老王不修改情書的內容？（完整性) 如何保證隔壁老王不冒充明明？（身份認證) 如何保證明明不能否認情書是自己寫的？（來源的不可否認) 上一節，我們使用了Ha

演算法導論程式3--最大子陣列問題（Python）

尋找最大子陣列問題：給定陣列A：尋找A中的和最大的非連續子陣列。我們稱這樣的連續子陣列為最大子陣列（maximum subarray）使用分治策略的求解方法：假定我們要尋找子陣列A[low...high]的最大子陣列。使用分治技術意味著我們要將子陣列劃分為兩個規模儘量

【演算法 in python | DP】子串和（乘積）最大

1. 最大子序和給定一個整數陣列 nums ，找到一個具有最大和的連續子陣列（子陣列最少包含一個元素），返回其最大和。nums中有正有負。 class Solution: def maxSubArray(self, nums): res = [0

演算法基礎：資料型別，基礎結構（一）

基礎概念一、資料型別基本資料型別一般長度 (注意以下的 long long 實際上指的是 unsigned long long 型別) (long long 型別數值範圍是-9223372036854775808 ~ 9223372036854775807)差不多範圍是

【資料結構與演算法-java實現】二複雜度分析（下）：最好、最壞、平均、均攤時間複雜度的概念

上一篇文章學習了：如何分析、統計演算法的執行效率和資源消耗？點選連結檢視上一篇文章：複雜度分析上今天的文章學習以下內容：最好情況時間複雜度最壞情況時間複雜度平均情況時間複雜度均攤時間複雜度 1、最好與最壞情況時間複雜度我們首先

8皇后以及N皇后演算法探究，回溯演算法的JAVA實現，遞迴方案（一）

八皇后問題，是一個古老而著名的問題，是回溯演算法的典型案例。該問題是國際西洋棋棋手馬克斯·貝瑟爾於1848年提出：在8×8格的國際象棋上擺放八個皇后，使其不能互相攻擊，即任意兩個皇后都不能處於同一行、同一列或同一斜線上，問有多少種擺法。高斯認為有76種方案。1854年在柏林的象棋雜誌

演算法 - 求子陣列的最大和（C++）

//**************************************************************************************************** // // 求子陣列的最大和 - C++ - by Chimomo // //

排序演算法3——圖解直接插入排序以及折半（二分）插入排序及其實現

排序演算法1——圖解氣泡排序及其實現（三種方法，基於模板及函式指標）排序演算法2——圖解簡單選擇排序及其實現排序演算法3——圖解直接插入排序以及折半（二分）插入排序及其實現排序演算法4——圖解希爾排序及其實現排序演算法5——圖解堆排序及其實現排序演算法6——圖解歸併排序及其遞迴與非

Google的cartographer SLAM演算法在Turtlebot3上的模擬實現教程（中）（已排坑！）

一、前言該篇為本文的重點，主要內容為 cartographer_turtlrbot3原始碼庫的安裝二、cartographer_turtlebot原始碼庫安裝這裡基本參考創客智造的安裝教程，但是由於教程中安裝的一些包版本已經更新，如果完全按照教程走的話會發現

hmm前後向演算法隱馬爾科夫模型HMM（三）鮑姆-韋爾奇演算法求解HMM引數隱馬爾科夫模型HMM（四）維特比演算法解碼隱藏狀態序列隱馬爾科夫模型HMM（一）HMM模型

跟醫生就醫推導過程是一樣的隱馬爾科夫模型HMM（一）HMM模型　　　　隱馬爾科夫模型HMM（二）前向後向演算法評估觀察序列概率　　　　隱馬爾科夫模型HMM（三）鮑姆-韋爾奇演算法求解HMM引數　　　　隱馬爾科夫模型HMM（四）維特比演算法解碼隱藏狀態序列　　　　在隱馬爾科夫模型HMM（一）

演算法設計例題：批處理作業排程（回溯）

給定n個作業的集合 J = { J1，J2，…，Jn }。每一個作業Ji都有兩項任務分別在兩臺機器上完成。每個作業必須先由機器1處理，然後由機器2處理。作業Ji需要機器j 的處理時間為tji，其實 i=1, 2, …, n，j=1, 2。對於一個確定的作業排程，設Fji是作

【演算法】B+樹的研讀及實現（1）

【前言】為什麼要明白b+樹？假如大家有操作資料庫及開發有關資料庫的經驗，那麼肯定知道索引這個概念，那麼進一步問你什麼叫索引？ mysql的索引就是B+樹，而其他資料庫我不太清楚，但是，b+樹是一般的索引演算法，當然，oracle、postgres等資料庫聽說也支援r樹的索

《常見演算法與資料結構》符號表ST（4）——二叉查詢樹刪除（附動畫）

符號表ST（4）——二叉查詢樹刪除（附動畫）本系列文章主要介紹常用的演算法和資料結構的知識，記錄的是《Algorithms I/II》課程的內容，採用的是“演算法（第4版）”這本紅寶書作為

【演算法】B+樹的研讀及實現（2）---java版核心程式碼

【前言】假如大家已經弄懂了b樹及b+樹那麼恭喜你們了，因為我覺得，b樹及b+樹是檔案系統尤其是資料庫優化的關鍵。這裡預告一下，下一篇課題（也不能說課題，只能用“業餘研究題目”這種稱呼）是R樹，R樹似乎是多維的B+樹，各位假如也希望弄懂R樹的話，請先好好看看b+樹。

【資料結構與演算法】002—樹與二叉樹（Python）

概念樹樹是一類重要的非線性資料結構，是以分支關係定義的層次結構定義：樹(tree)是n(n>0)個結點的有限集T，其中：有且僅有一個特定的結點，稱為樹的根(root) 當n>1時，其餘結點可分為m(m>0)個互不相交的有限集T1,T2,……Tm，其中每一個集合本身又是一棵

兩種簡單的陣列排序演算法：氣泡排序和直接選擇排序（升序）

氣泡排序的基本思想是：面對一排資料，先從前往後兩兩比較，如果前一個數比後一個數大就交換兩者的順序，即第一個數和第二個數比，第二個數和第三個數比，……,倒數第二個數和最後一個數比，這樣一輪下來以後最大的數就排到最後；接著把除去最大的數的該組資料進行同樣的操作，直至

【機器學習演算法-python實現】決策樹-Decision tree（1）資訊熵劃分資料集

1.背景決策書演算法是一種逼近離散數值的分類演算法，思路比較簡單，而且準確率較高。國際權威的學術組織，資料探勘國際會議ICDM （the IEEE International Con

基於粒子群演算法的概率神經網路實現多分類（PSO_PNN）

基於粒子群演算法的概率神經網路實現多分類：用粒子群演算法（PSO）實現概率神經網路中（PNN）的引數spread的最優化，並用PNN實現訓練並測試多類別資料，多分類效果很棒，有需要請聯絡[email protected]，需要一定費用。

K-means演算法的matlab程式 K-means演算法的matlab程式（初步）

K-means演算法的matlab程式

1.採用iris資料庫

2.matlab源程式：

3.結果

相關推薦