高斯混合模型學習筆記

阿新 • • 發佈：2018-12-31

0 預備知識

l 設離散型隨機變數X的分佈律為

則稱為X的數學期望或均值

l 設連續型隨機變數X的概率密度函式（PDF）為

其數學期望定義為

l 稱為隨機變數X的方差，稱為X的標準差

l 正態分佈 ~

概率密度函式

l 設（X, Y）為二維隨機變數，若存在，則稱其為隨機變數X和Y的協方差，記為

l 多維高斯（正態）分佈概率密度函式PDF定義如下：

其中，x是維數為n的樣本向量（列向量），是期望，是協方差矩陣，表示的行列式，表示的逆矩陣，表示的轉置。

1 高斯混合模型概述

1.1. 單高斯模型（Single GaussianModel, SGM）

（1）

對於單高斯模型，由於可以明確訓練樣本是否屬於該高斯模型（如訓練人臉膚色模型時，將人臉影象膚色部分分割出來，形成訓練集），故μ通常由訓練樣本均值代替，由樣本方差代替。為了將高斯分佈用於模式分類，假設訓練樣本屬於類別K，那麼，式(1)可以改為如下形式：

（2）

式(2)表明樣本屬於類別K的概率大小。從而將任意測試樣本輸入式(2)，均可以得到一個標量，然後根據閾值t來確定該樣本是否屬於該類別，閾值t可以為經驗值，也可以通過實驗確定。

1.2. 高斯混合模型（GaussianMixture Model，GMM）

高斯混合模型是單一高斯概率率密度函式的延伸。例如：有一批觀察資料

，資料個數為n，在d 維空間中的分佈不是橢球狀（如圖 1(a)），那麼就不適合以一個單一的高斯密度函式來描述這些資料點的概率密度函式。此時我們採用一個變通方案，

假設每個點均由一個單高斯分佈生成（如圖 1(b)，具體引數，未知），而這一批資料共由M（明確）個單高斯模型生成，具體某個資料屬於哪個單高斯模型未知，且每個單高斯模型在混合模型中佔的比例未知，將所有來自不同分佈的資料點混在一起，該分佈稱為高斯混合分佈。

從數學上講，我們認為這些資料的概率分佈密度函式可以通過加權函式表示：，其中

表示第j個SGM的PDF。

令，GMM共有M個SGM，現在，我們就需要通過樣本集X來估計GMM的所有引數：

，樣本X的概率公式為：

通常用EM（ExpectationMaximum）演算法對GMM引數進行估計。

演算法流程：

（1）初始化

方案1：協方差矩陣設為單位矩陣，每個模型比例的先驗概率；均值設為隨機數。

方案2：由k均值（k-means）聚類演算法對樣本進行聚類，利用各類的均值作為，並計算，取各類樣本佔樣本總數的比例。

（2）估計步驟（E-step）

令的後驗概率為

（3）最大化步驟（M-step）

更新權值：

更新均值：

更新方差矩陣：

（4）收斂條件

不斷地迭代步驟（2）和（3），重複更新上面三個值，直到，其中為更新引數後計算的值，即前後兩次迭代得到的結果變化小於一定程度則終止迭代，通常。

1.3. K-means演算法

k-means演算法是輸入聚類個數k，以及包含 n個資料物件的資料庫，輸出滿足方差最小標準的k個聚類。同一聚類中的物件相似度較高；而不同聚類中的物件相似度較小。聚類相似度是利用各聚類中物件的均值所獲得一個“中心物件”（引力中心）來進行計算的。

k-means演算法的基本步驟：

（1）從 n個資料物件任意選擇k個物件作為初始聚類中心；

（2）根據每個聚類物件的均值（中心物件），計算每個物件與這些中心物件的距離；並根據最小距離重新對相應物件進行劃分；

（3）重新計算每個（有變化）聚類的均值（中心物件）；

（4）計算標準測度函式，當滿足一定條件，如函式收斂時，則演算法終止；如果條件不滿足則回到步驟（2）。

高斯混合模型學習筆記

0 預備知識 l 設離散型隨機變數X的分佈律為則稱為X的數學期望或均值 l 設連續型隨機變數X的概率密度函式（PDF）為其數學期望定義為 l 稱為隨機變數X的方差，稱為X的標準差 l 正態分佈 ~ 概率密度函式 l 設（X, Y）為二維隨機變數，若存在

【機器學習】EM演算法在高斯混合模型學習中的應用

前言 EM演算法，此部落格介紹了EMEM演算法相關理論知識，看本篇部落格前先熟悉EMEM演算法。本篇部落格打算先從單個高斯分佈說起，然後推廣到多個高斯混合起來，最後給出高斯混合模型引數求解過程。單個高斯分佈假如我們有一些資料，這些資料來自同一個

CS229 Machine Learning學習筆記:Note 7(K-means聚類、高斯混合模型、EM算法)

learn 不同的 inf ear 公式 course splay alt spa K-means聚類 ng在coursera的機器學習課上已經講過K-means聚類，這裏不再贅述高斯混合模型問題描述聚類問題：給定訓練集\(\{x^{(1)},\cdots,x^{(m

Stanford機器學習課程筆記4-Kmeans與高斯混合模型

這一部分屬於無監督學習的內容，無監督學習內容主要包括：Kmeans聚類演算法、高斯混合模型及EM演算法、Factor Analysis、PCA、ICA等。本文是Kmeans聚類演算法、高斯混合模型的筆記，EM演算法是適用於存在latent/hidden變數的通用演算法，高斯混

高斯混合模型（GMM）介紹以及學習筆記

1.高斯混合模型概述高斯密度函式估計是一種引數化模型。高斯混合模型（Gaussian Mixture Model, GMM）是單一高斯概率密度函式的延伸，GMM能夠平滑地近似任意形狀的密度分佈。高斯混合模型種類有單高斯模型（Single Gaussian Model, S

機器學習讀書筆記（高斯混合模型GMM與EM）（改）

高斯混合模型（Gaussian mixture model，GMM）是單一高斯概率密度函式的延伸。GMM能夠平滑地近似任意形狀的密度分佈。欲瞭解高斯混合模型，那就先從基礎的單一高斯概率密度函式講起。（數學公式字型太難看了！！！！！！！）注意：這一一篇致力於詳

Spark2.0機器學習系列之10：聚類(高斯混合模型 GMM）

在Spark2.0版本中（不是基於RDD API的MLlib），共有四種聚類方法：（1）K-means （2）Latent Dirichlet allocation (LDA) （3）Bisecting k-m

【機器學習】機器學習（十二、十三）：K-means演算法、高斯混合模型

簡介：本節介紹STANFORD機器學習公開課中的第12、13集視訊中的演算法：K-means演算法、高斯混合模型（GMM）。（9、10、11集不進行介紹，略過了哈）一、K-means演算法屬於無監督學習的聚類演算法，給定一組未標定的資料

斯坦福大學機器學習——EM演算法求解高斯混合模型

EM演算法（Expection-Maximizationalgorithm，EM）是一種迭代演算法，通過E步和M步兩大迭代步驟，每次迭代都使極大似然函式增加。但是，由於初始值的不同，可能會使似然函式陷入區域性最優。辜麗川老師和其夫人發表的論文：基於分裂EM演算法的GMM引數

估計高斯混合模型參數的三種方式

als .so ons die from ssi object sqrt int 對於如下的兩類別的高斯混合模型 \[ \pi\cdot N(\mu_1,\sigma_1^2)+(1-\pi)\cdot N(\mu_2,\sigma_2^2) \] 參數為\(\theta

EM演算法與高斯混合模型

由k個高斯模型加權組成，α是各高斯分佈的權重，Θ是引數。對GMM模型的引數估計，就要用EM演算法。更一般的講，EM演算法適用於帶有隱變數的概率模型的估計，即不同的高斯分佈所對應的類別變數。為何不能使用極大似然估計，如果直接使用極大似然估計

網格缺陷檢測（高斯混合模型GMM）

*此示例程式向您展示如何使用GMM分類器進行新穎性檢測以執行Web檢查任務。要進行新奇檢測， *計算屬於單個訓練類的所有畫素，然後進行計算從分類ROI中減去以提取錯誤畫素。對於網路檢查任務，GMM因此可用於檢測紋理與訓練好的物體的紋理不對應。 &nb

Python中呼叫OpenCV介面中的高斯混合模型，實現對運動目標的檢測，並保存錄制視訊

Python中呼叫OpenCV介面中的高斯混合模型(GMM)，實現對運動目標的檢測 import numpy as np import cv2 # TODO: 本程式碼使用OpenCV介面中的高斯混合模型，實現對運動目標的檢測 cap = cv2.VideoCapture(

高斯混合模型(GMM Gaussian Mixture Model)

高斯混合模型是一種業界廣泛使用的聚類演算法，該方法使用了高斯分佈作為引數模型，並使用了期望最大演算法（EM）進行訓練。什麼是高斯分佈高斯分佈有時也被稱作正態分佈，是一個在數學、物理及工程等領域都非常重要的概率分佈，在統計學的許多方面都有著重大的影響。若隨機變數X服從一個數學

高斯混合模型（Gaussian Mixture Model，GMM）

先從簡單的離散型隨機變數看起離散型隨機變數P{X=ak}=pk,k=1,2,3,...,n 其中：∑i=1npi=1 那麼它的期望值是：E(X)=∑kakpk 以上都是中學數學知識，那麼到了高等數學的概率論與數理統計這門課才開始討論連續隨機變數的情況。

聚類之高斯混合模型（Gaussian Mixture Model）

k-means應該是原來級別的聚類方法了，這整理下一個使用後驗概率準確評測其精度的方法—高斯混合模型。我們談到了用 k-means 進行聚類的方法，這次我們來說一下另一個很流行的演算法：Gaussian Mixture Model (GMM)。事實上，GMM

高斯混合模型視訊背景建模的EM演算法與Matlab 實現

1.問題描述影像的背景前景分離. 輸⼊為影像監控的1000 幀 (如下⽅圖中左邊所⽰), 要求輸出是背景和前景 (如下⽅圖中右邊所⽰). 2.背景知識觀察待處理的監控影像，可以發現，前景主要是來來往往的行人，背景始終是攝像頭對準的固定區域，

05 EM演算法 - 高斯混合模型 - GMM

04 EM演算法 - EM演算法收斂證明 __GMM__(Gaussian Mixture Model, 高斯混合模型)是指該演算法由多個高斯模型線性疊加混合而成。每個高斯模型稱之為component。 __GMM演算法__描述的是資料的本身存在的一種分佈，即樣本特徵屬性的分佈，和預測值Y無關。顯然G

聚類之高斯混合模型（Gaussian Mixture Model）【轉】

k-means應該是原來級別的聚類方法了，這整理下一個使用後驗概率準確評測其精度的方法—高斯混合模型。我們談到了用 k-means 進行聚類的方法，這次我們來說一下另一個很流行的演算法：Gaussian Mixture Model (GMM)。事實上，GMM 和 k-means 很像，不過 GMM 是學習

高斯混合模型聚類演算法和K-Means聚類演算法

高斯混合模型聚類演算法概念：混合高斯模型就是指對樣本的概率密度分佈進行估計，而估計的模型是幾個高斯模型加權之和（具體是幾個要在模型訓練前建立好）。每個高斯模型就代表了一個類（一個Cluster）。