資料學習(9)·最大期望演算法·混合高斯模型(上)

作者課堂筆記摘錄，有問題請聯絡 [email protected]

Preview

1. 高斯混合模型（Mixture of Gaussians）
1. 最大期望演算法（EM）
1. 因子分析（Factor Analysis）

1 高斯混合（Mixture of Gaussians）

什麼是高斯混合模型，我們可以簡單理解為資料的生成來自不同的高斯分佈，如上的鳶尾花資料集的例子，我們可以理解資料的生成是通過不同的高斯分佈產生的，可推廣到一般混合模型，只不過高斯分佈我們使用的比較多而已。

一個混合模型假設資料產生於下列步驟：

<1> 隱變數 $z^{(i)}\in{1....K}$ ,並且 $z^{(i)}\sim Multinomial(\phi)$
$p(z^{(i)}=j)=\phi_j \quad for \quad all\quad j$
我們可以理解這個 $z$ 為隱變數，也就是當資料產生時選擇第幾個高斯分佈來產生這個資料。
<2> 觀測資料 $x^{(i)}$ 來自分佈 $p(z^{(i)},x^{(i)}):$
$p(z^{(i)},x^{(i)})=p(z^{(i)})p(x^{(i)}|z^{(i)})$
可以理解為觀測資料的產生也取決於隱變數，也就是當我們想要產生該資料時首先以一定的概率選擇適合的高斯分佈，之後在此分佈下產生資料。

$z^{(i)}\sim Multinomial(\phi)$
$x^{(i)}|z^{(i)}\sim \N(\mu_j,\Sigma_j)$
怎麼學習所有的引數 $\phi_j,\mu_j,\Sigma_j?$

如果 $z^{(i)}$ 是已知的：
（監督學習）使用最大似然估計來學習引數，類比之前部落格二次判別分析.
如果 $z^{(i)}$ 是未知的：
（無監督學習）使用最大期望演算法。

2 最大期望演算法（EM）

最大期望演算法是一種迭代演算法當模型中還有隱變數時,求最大似然估計的一種方法。
資料的最大似然估計：
$l(\theta)=\sum_{i=1}^mlogp(x;\theta)=\sum_{i=1}^mlog\sum_zp(x,z;\theta)$
我們可以如此理解上式，我們可以用X表示觀測隨機變數的資料，Z表示隱隨機變數的資料。X和Z連在一起稱為完全資料，觀測資料X又稱為不完全資料。假定給出觀測資料X，其概率分佈 $P(X|\theta)$ 其中 $\theta$ 是需要估計的模型引數，那麼不完全資料X的似然函式是 $P(X|\theta)$ ,對數似然函式是 $L(\theta)=logP(X|\theta)$ ;假設X和Z的聯合概率分佈是 $P(X,Z|\theta)$ ,那麼完全資料對數似然函式是 $logP(X,Z|\theta)$ .

EM 演算法通過迭代求 $logP(X|\theta)$ 的極大似然估計，每次迭代分為兩步：E步求期望，M步求極大值。

廣義的EM演算法：

初始化 $\theta$
重複直到收斂{

E-Step:

對於每個 $i$ ,使 $Q_i(z^{(i)}):=p(z^{(i)}|x^{(i)};\theta)$

M-Step:

使 $\theta:=argmax_\theta\sum_i\sum_{z^{(i)}}Q_i(z^{(i)})log\frac{p(x^{i},z^{(i)};\theta)}{Q_i(z^{(i)})}(*)$

資料學習(9)·最大期望演算法·混合高斯模型(上)

Preview

1 高斯混合（Mixture of Gaussians）

2 最大期望演算法（EM）

廣義的EM演算法：

E-Step:

M-Step:

資料學習(9)·最大期望演算法·混合高斯模型(上)

資料學習(10)·最大期望演算法·因子分析模型(下)

機器學習之最大期望(EM)演算法

資料探勘十大演算法----EM演算法（最大期望演算法）

EM最大期望演算法與jensen不等式

MLE極大似然估計和EM最大期望演算法

機器學習之混合高斯模型(Gaussian Mixture Model)聚類演算法+程式碼

機器學習筆記（十）EM演算法及實踐（以混合高斯模型（GMM）為例來次完整的EM）

【機器學習】貝葉斯線性迴歸（最大後驗估計+高斯先驗）

非監督學習之混合高斯模型和EM演算法——Andrew Ng機器學習筆記（十）

GMM混合高斯模型演算法詳解

高斯分佈的資訊熵最大。即，高斯分佈是最混亂系統。

EM算法與混合高斯模型

robots_estimation and learning之混合高斯模型

聚類(1)——混合高斯模型 Gaussian Mixture Model

混合高斯模型（matlab）

sklearn聚類模型：基於密度的DBSCAN；基於混合高斯模型的GMM

EM(期望最大演算法)在高斯混合模型中的python實現

2018.11.14——最大期望（EM）演算法

大資料學習——過濾及推薦常用演算法簡介

資料學習(9)·最大期望演算法·混合高斯模型(上)

Preview

1 高斯混合（Mixture of Gaussians）

2 最大期望演算法（EM）

廣義的EM演算法：

E-Step:

M-Step:

相關推薦