【習題集四】無監督學習和強化學習

阿新 • • 發佈：2019-01-06

1. 監督學習的EM演算法 EM for Supervised Learning

我們曾推導過針對無監督學習的EM演算法，，其中，我們將p(x)表示為，其中z是隱含引數

下面我們將嘗試將EM演算法應用於監督學習模型，並討論“混合線性迴歸Mixture of Linear Regressors”模型，這是一種專業模型層次化混合Hierarchial Mixture of Expert Model的一個例項，其公式為.

為了簡化模型，我們將z設為一個二元變數，並認為p(y|x, z)服從高斯分佈，且p(y|x)可由logistic迴歸模型描述，因此我們有如下公式

其中σ是已知引數，我們希望求得n維向量φ、θ0、θ1，且θ的下標僅表示不同的引數向量，不表示不同的輸入。

直觀而言，這一過程可被理解為如下過程：給定一個數據點x，我們先根據logistic模型確定其隱含引數的分類，如z=0或z=1；在此基礎上認為y是x的線性函式並加上一些高斯誤差（不同的z對應不同的線性方程）。如下圖所示

（1）假設x、y、z都可被觀測到，即我們有訓練集{(x1, y1, z1), (x2, y2, z2), (xm, ym, zm)}。給出引數的最大對數似然方程，並給出φ、θ0、θ1的最大似然估計。注意到由於p(z|x)為logistic模型，故φ沒有一個閉式的精確解，因此我們可以通過給出其Hessian矩陣和對φ求導的結果。

解：對數似然函式為

將其對θ0求導，並令結果為0，我們有

但這只是資料集的子集中的最小平方誤差問題，事實上，如果我們令所有的z均為0，通過同樣的方法，我們可得到關於θ0的最大似然估計為

同理我們也可以獲得對θ1進行最大似然估計的結果。

將對數似然函式對φ求導，並忽略與φ無關的項，可得如下方程

這是一個典型的logistic迴歸方程，我們已知其導數和Hessian矩陣為

（2）現在假設z是一個隱含（不可見）的隨機變數，給出引數的對數似然函式，並推導求得對數似然函式最大值的EM演算法，主要應當明顯區分E步和M步（再次提醒，M步要求數值解，給出導數和Hessian矩陣即可）

解：對數似然函式為

在EM演算法中的E步我們將計算下式

在M步中，我們首先定義

對j=0或1均成立（但實際中我們只需計算一個即可，如計算w0，此時w1=1-w0）。將我們的對數似然函式的下界對θ0求導，移去無關項，並將表示式的結果設為0，可得下式為

這是一個典型的加權最小平方問題，其解為

對θ1的求導過程也是相似的。

為了給出對φ的導數和Hessian矩陣，我們注意到

此時導數和Hessian矩陣可表示為

2. 因子分析和主成分分析 Factor Analysis and PCA

設z為一個k維向量，其為一個隱含引數，且分佈(x, z)滿足

其中U是一個n*k的模型引數矩陣，σ是一個已知的常量。這一模型常被稱為概率主成分分析模型Probabilitic PCA。注意到這跟因子分析模型很像，只是我們假設x|z的方差是一個已知的矩陣，而不是簡單的對角引數矩陣Φ，並且我們沒有對均值項增加噪聲μ（儘管這只是為了簡化表示）。在這一模型中，如果我們令σ為0，則其就是我們討論的PCA模型。

為了簡化問題，我們認為在之後的討論中k=1，即U是一個n維的列向量。

（1）使用控制高斯分佈Manipulating Gaussian Distribution確定(x, z)的聯合分佈和條件分佈z|x。【提示：對於條件分佈，使用習題集一中給出的(λI+BA)^-1*B=B*(λI+AB)^-1可以簡化運算】

解：為了計算聯合分佈，我們計算x和z的均值和方差，我們已知E[z]=0，並有

由於x和z的均值都為0，因此我們有

因此，x和z的聯合分佈為

使用條件概率分佈的相關定理，z|x的均值和方差為

（2）推導針對上述模型的EM演算法，並明確給出E步和M步。

解：注意：儘管z(i)是一個標量，為了保持和因子分析演算法的一致，我們依然使用它的轉置符號。

在E步中，我們首先計算

在M步中，我們需要將下式最大化

將上式對U求導，移除無關項，為

令上式結果為0，則有

（3）當σ趨近於0時，證明如果EM演算法趨向於引數向量U*，則U*必為矩陣的特徵向量，即滿足【提示：當σ趨向於0時，Σz|x也趨向於0，所以E步只需計算μz|x即可，令m維向量w包含所有均值，即wi=μz(i)|x(i)，並證明E步和M步可表示為.最後證明如果U在更新後值沒有發生變化，則其一定為特徵向量】