EM演算法：從極大似然估計匯出EM演算法（還算通俗易懂）

之前看了《統計學習方法》，吳恩達老師的cs229講義，一起看感覺很昏（如果要看建議選擇其中一個，《統計學習方法》裡面基本很少會寫到 $y_i$ 而都是用 $Y$

Y

只用了極大化沒有寫出我們熟悉的似然函式？！，cs229有視訊，但我喜歡看書），網上看了點部落格大部分好像也是來自cs229講義。這裡結合七月裡面一個博士講的與自己的理解來寫出從極大似然估計推出EM演算法好了。

1、隱變數與概率模型引數

EM演算法：概率模型有時既含有觀測變數，又含有隱變數。如果概率模型的變數都是觀測變數，那麼給定資料，就可以直接使用極大似然估計來求得引數或者貝葉斯估計模型引數。但是如果變數中有因變數，那麼這些方法就不行了，這個時候就可以使用EM演算法，EM演算法就是含有隱變數的概率模型引數的極大似然估計方法。

下面給出《統計學習方法》中的例子

在這裡插入圖片描述

觀測結果 $1, 1, 0, 1, 0,$

0 , 1 , 0 , 1 , 1 {1,1,0,1,0,0,1,0,1,1}

1, 1, 0, 1, 0, 0, 1, 0, 1, 1

我們用變數

Y

表示，叫做顯變數，這裡取值是0或1

而擲的硬幣A的結果我們是不知道的，我們用變數 $Z$ 表示，叫做隱變數

2、EM演算法推導

而 $\pi，p，q$ 則是模型引數，現在我們要求這三個引數。由於是改了模型，我們知道觀測結果來求引數，自然想到使用極大似然估計。根據極大似然估計定義，概率分佈 $P(Y=y_i)=p_\theta(y_i;)$ ，其中 $\theta$ 為模型引數

先回顧下概率公式（推導會用到）：
$p(y)=\sum\limits_{z}p(z)p(y|z)=\sum\limits_{z}p(y,z)$ 全概率公式和貝葉斯公式
$\sum\limits_{z}p(z|y)=1$

寫出極大似然函式

$L(\theta)=\prod\limits_{i=1}^{n}p_\theta(y_i)\\=\prod\limits_{i=1}^{n}\sum\limits_{z}p_\theta(y_i,z)\\=\prod\limits_{i=1}^{n}\sum\limits_{z}p_\theta(z)p_\theta(y_i|z)$

寫出對數形式

$l(\theta)=lnL(\theta)=ln\prod\limits_{i=1}^{n}\sum\limits_{z}p_\theta(z)p_\theta(y_i|z)=\sum\limits_{i=1}^{n}ln[\sum\limits_{z}p_\theta(z)p_\theta(y_i|z)]$

通常到這裡就要對引數求導 $\theta$ 求導從而得到似然函式的極大值，但是這裡由於對數裡面存在求和，這種情況是難以求解的。這種情況下，通常的做法是使用迭代逐步去畢竟最優解，而EM演算法就是這樣一種迭代演算法，假設第 $n$ 次迭代求出的引數為 $\theta_n$ ，我們希望下一次迭代得到的引數滿足 $l(\theta_{n+1})>l(\theta_{n})$

$l(\theta)-l(\theta_n)=\sum\limits_{i=1}^{n}(ln\sum\limits_{z}p_\theta(z)p_\theta(y_i|z)-ln^{p_{\theta_n}(y_i))}$

對 $p_\theta(z)p_\theta(y_i|z)$

EM演算法：從極大似然估計匯出EM演算法（還算通俗易懂）

1、隱變數與概率模型引數

2、EM演算法推導

EM演算法：從極大似然估計匯出EM演算法（還算通俗易懂）

MLE極大似然估計和EM最大期望演算法

極大似然估計與EM演算法

機器學習演算法（1）——極大似然估計與EM演算法

極大似然估計和EM演算法

python機器學習案例系列教程——極大似然估計、EM演算法

極大似然估計和EM算法

從極大似然估計的角度理解深度學習中loss函式

使用EM演算法對含有缺失資料的聯合泊松分佈的引數進行極大似然估計

缺失資料的極大似然估計：《Statistical Analysis with Missing Data》習題7.16

機器學習筆記（一）：極大似然估計與貝葉斯估計的區別

01 EM演算法 - 大綱 - 最大似然估計(MLE)、貝葉斯演算法估計、最大後驗概率估計(MAP)

機器學習：極大似然估計

最大似然估計演算法（極大似然估計演算法）

MATLAB學習筆記：極大似然估計

概率統計與機器學習：獨立同分布，極大似然估計，線性最小二乘迴歸

【ML學習筆記】17：多元正態分佈下極大似然估計最小錯誤率貝葉斯決策

機器學習演算法篇：最大似然估計證明最小二乘法合理性

極大似然估計：一個例子

數理統計7：矩法估計（MM）、極大似然估計（MLE），定時截尾實驗

EM演算法：從極大似然估計匯出EM演算法（還算通俗易懂）

1、隱變數與概率模型引數

2、EM演算法推導

相關推薦