模式識別經典演算法——Kmeans影象聚類分割（以最短的matlab程式實現）

阿新 • • 發佈：2019-01-31

kmeans之於模式識別，如同“hello world”之於C、之於任何一門高階語言。

演算法的規格（specification）

在聚類問題（一般非監督問題）中，給定訓練樣本X={x(1),x(2),…,x(N)}，每個x(i)∈Rd。kmeans演算法的職責在於將這N個樣本聚類成k個簇（cluster, μ1,μ2,…,μk），流程如下：

隨機選取k個聚類中心(cluster centroids)為μ1,μ2,…,μk
C = X(randperm(m*n, k), :); # 程式語言

重複一下過程直至收斂
{
對於每一個樣本i

，根據最近鄰（歐氏距離度量）計算其所屬分類

c(i):=argminj∥x(i)−μj∥2
對於每一個類j，重新計算該類的質心（centroids）
μj:=∑mi=11{c(i)=j}x(i)∑mi=11{c(i)=j}
}

演算法的規格：

一個引數k，聚類中心的數目，當然也有一些常規的引數，比如最大迭代次數epochs，容忍度tol
一個迴圈，判斷目標函式是否變化足夠小，以F範數（Frobenius norm）為度歸。

while true,
    ...
    if norm(J_cur-J_prev, 'fro' 
) < tol,
        break;
    end
    J_prev = J_cur;
end

一條更新語句，更新各個類的聚類中心，根據每個樣本應屬的類別（歐式距離最小表徵）

μj:=∑mi=11{c(i)=j}x(i)∑mi=11{c(i)=j}

這個公式看似高大上，實則不值一提，翻譯過來就是新的聚類中心（centroid）在該類別空間的中心處。

    dist = sum(X.^2, 2)*ones(1, k) + (sum(C.^2, 2)*ones(1, m*n))'...
        - 2*X*C';
    [~, idx] = min(dist, [] 
, 2) ;
    for i = 1:k,
       C(i, :) = mean(X(idx == i , :)); # 對應於這樣一條語句
    end

matlab實現

客戶端（client）程式

clear all; close all;
I = imread('./lena.bmp');
[m, n, p] = size(I);
k = 7;
[C, label, J] = kmeans(I, k);
I_seg = reshape(C(label, :), m, n, p);
figure
subplot(1, 2, 1), imshow(I, []), title('原圖')
subplot(1, 2, 2), imshow(uint8(I_seg), []), title('聚類圖')
figure
plot(1:length(J), J), xlabel('#iterations')

kmeans函式

function [C, label, J] = kmeans(I, k)
[m, n, p] = size(I);
X = reshape(double(I), m*n, p);
rng('default');
C = X(randperm(m*n, k), :);
J_prev = inf; iter = 0; J = []; tol = 1e-2;
while true,
    iter = iter + 1;
    dist = sum(X.^2, 2)*ones(1, k) + (sum(C.^2, 2)*ones(1, m*n))' - 2*X*C';
    [~, label] = min(dist, [], 2) ;
    for i = 1:k,
       C(i, :) = mean(X(label == i , :));
    end
    J_cur = sum(sum((X - C(label, :)).^2, 2));
    J = [J, J_cur];
    display(sprintf('#iteration: %03d, objective fcn: %f', iter, J_cur));
    if norm(J_cur-J_prev, 'fro') < tol,
        break;
    end
    J_prev = J_cur;
end

實驗結果

目標函式收斂情況

目標函式

J(c,μ)=∑i=1m∥x(i)−μc(i)∥2
matlab計算程式：

J_cur = sum(sum((X - C(label, :)).^2, 2));

這裡寫圖片描述

效果圖

這裡寫圖片描述

模式識別經典演算法——Kmeans影象聚類分割（以最短的matlab程式實現）

kmeans之於模式識別，如同“hello world”之於C、之於任何一門高階語言。演算法的規格（specification）在聚類問題（一般非監督問題）中，給定訓練樣本X={x(1),x(2),…,x(N)}，每個x(i)∈Rd。kmeans

模式識別經典演算法——LDA

線性判別式分析，又稱為Fisher線性判別~（Linear discriminant analysis）(Fisher linear discriminant) 最大化類間均值，最小化類內方差通過調整權重向量元件，可選擇一個投影方向，最大化地類別分離性~ 兩個類的均值向

8、人臉識別經典演算法一：特徵臉方法（Eigenface）

這篇文章是擼主要介紹人臉識別經典方法的第一篇，後續會有其他方法更新。特徵臉方法基本是將人臉識別推向真正可用的第一種方法，瞭解一下還是很有必要的。特徵臉用到的理論基礎PCA在另一篇部落格裡：。本文的參考資料附在最後了^_^ 步驟一：獲取包含M張人臉影象的集合S。在我們的

MATLAB聚類分割程式影象聚類分割

clc,clear;I=imread('egg4.bmp');I1=I(:,:,1);I2=I(:,:,2);I3=I(:,:,3);[y,x,z]=size(I);d1=zeros(y,x);d2=d1;myI=double(I);I0=zeros(y,x);for i=1:x for j=1:y

[python] Kmeans文字聚類演算法+PAC降維+Matplotlib顯示聚類影象

0 前言本文主要講述以下幾點： 1.通過scikit-learn計算文字內容的tfidf並構造N*M矩陣(N個文件 M個特徵詞)； 2.呼叫scikit-learn中的K-means進行文字聚類； 3.使用PAC進行降維處理，每

模式識別：C-means(K-means)聚類演算法與分級聚類(層次聚類)演算法

C均值聚類演算法與分級聚類演算法的聚類分析一、實驗目的理解聚類的整體思想，瞭解聚類的一般方法；掌握 C-means與分級聚類演算法演算法思想及原理，並能夠熟練運用這些演算法進行聚類分析；能夠分析二者的優缺點二、實驗內容採用C均

CNN autoencoder 先降維再使用kmeans進行影象聚類是不是也可以降維以後進行iforest處理？

import keras from keras.datasets import mnist from keras.models import Sequential from keras.layers import Dense, Activation, Flatten from keras.layers

【看論文】之《西紅柿果實目標識別方法研究-基於模糊聚類演算法_王富春》

論文資訊題目：西紅柿果實目標識別方法研究-基於模糊聚類演算法論文作者：王富春等作者單位：柳州職業技術學院期刊：農機化研究提交時間：2014-10-20 摘要為識別成熟的西紅柿目標，提出了一種“模糊C-均值聚類演算法（Fuzzy Clustering Mea

《機器學習實戰》KMeans均值聚類演算法

一、引言聚類是一種無監督學習，對一些沒有標籤的資料進行分類。二、K均值聚類演算法2.1 演算法過程:隨機確定K個初始點為質心（簇個數k由使用者給定），計算資料集中每個點到每個質心的距離本次採用的是歐式距離，然後將資料集中的每個點尋找距其最近的質心，分配到對應的簇中完成後，每個

sklearn實戰：對文件進行聚類分析（KMeans演算法）

%matplotlib inline import matplotlib.pyplot as plt import numpy as np from time import time from sklearn.datasets import load_fi

瞭解 kmeans演算法和譜聚類演算法

譜聚類演算法不過真正要直觀地理解譜聚類，其實應該從物理的簡正模振動的角度來理解。你可以認為每兩個點之間都有一個彈簧連著，把兩個點之間的相似度理解為它們的彈簧係數，每個特徵向量就是這個系統的運動

python實現Kmeans文字聚類，通過PCA降維和Matplotlib顯示聚類3d三維影象

首先感謝Eastmount寫的內容http://blog.csdn.net/Eastmount/article/details/50545937。點選開啟連結在此基礎上，主要實現以下改進及結果 1.替換使用sklearn.feature_extraction.text.T

基於Sklearn原生Kmeans演算法的自動化聚類

from sklearn.cluster import KMeans import numpy as np import matplotlib.pyplot as plt from pandas import Series import random from

12.【基礎】手寫體數字影象聚類--KMeans

本文所有實現程式碼均來自《Python機器學習及實戰》 #-*- coding:utf-8 -*- #分別匯入numpy、matplotlib、pandas，用於數學運算、作圖以及資料分析 import numpy as np import matplo

【機器學習】：Kmeans均值聚類演算法原理(附帶Python程式碼實現)

這個演算法中文名為k均值聚類演算法，首先我們在二維的特殊條件下討論其實現的過程，方便大家理解。第一步.隨機生成質心由於這是一個無監督學習的演算法，因此我們首先在一個二維的座標軸下隨機給定一堆點，並隨即給定兩個質心，我們這個演算法的目的就是將這一堆點根據它們自身的座標特徵分為兩類，因此選取了兩個質心，什麼時

R語言 Kmeans每次聚類結果不同的問題

問題闡述：同樣的資料，同樣的命令，重複執行命令時，發現每個cluster裡面的個數都在變化問題原因：k-means演算法中起點是隨機或者認為給定的，如果初始類中心發生改變，可能會導致結果改變解決問題的方法： 1、把初始隨機數進行固定 2、自己設定初始隨機種子 R語言中程式

ML之Clustering之普聚類演算法：普聚類演算法的相關論文、主要思路、關鍵步驟、程式碼實現等相關配圖之詳細攻略

ML之Clustering之普聚類演算法：普聚類演算法的相關論文、主要思路、關鍵步驟、程式碼實現等相關配圖之詳細攻略普聚類演算法的相關論文 1、論文推薦 Clustering by fast search and find of density peak.

聚類路線圖（演算法選擇）

一般實驗選擇sklearn包。需要從兩個方面看。資料量和樣本分佈。建議看下面兩個圖和連結進行粗選。一般實驗選擇sklearn包。需要從兩個方面看。資料量和樣本分佈。建議看下面兩個圖和連結進行粗選。連結：http://skl

【Python例項第20講】手寫數字識別問題的K-Means聚類

機器學習訓練營——機器學習愛好者的自由交流空間（qq 群號：696721295）在這個例子裡，我們在手寫數字識別資料集上，比較 K-means 聚類演算法對於不同的初始化策略對執行時間和結果質量的影響。我們也利用不同的聚類質量測度判別聚類標籤對於參考標籤的擬合優度。這裡使

利用模擬退火提高Kmeans的聚類精度

　http://www.cnblogs.com/LBSer/p/4605904.html 　　Kmeans演算法是一種非監督聚類演算法，由於原理簡單而在業界被廣泛使用，一般在實踐中遇到聚類問題往往會優先使用Kmeans嘗試一把看看結果。本人在工作中對Kmeans有過多次實踐，進行過使用者行為聚類

模式識別經典演算法——Kmeans影象聚類分割（以最短的matlab程式實現）

演算法的規格（specification）

matlab實現

客戶端（client）程式

kmeans函式

實驗結果

目標函式收斂情況

效果圖

相關推薦