機器學習中的隱馬爾科夫模型（HMM）詳解

前導性推薦閱讀資料：

歡迎關注白馬負金羈的部落格 http://blog.csdn.net/baimafujinji，為保證公式、圖表得以正確顯示，強烈建議你從該地址上檢視原版博文。本部落格主要關注方向包括：數字影象處理、演算法設計與分析、資料結構、機器學習、資料探勘、統計分析方法、自然語言處理。

引言

在之前介紹貝葉斯網路的博文中，我們已經討論過概率圖模型（PGM）的概念了。Russell等在文獻【1】中指出：“在統計學中，圖模型這個術語指包含貝葉斯網路在內的比較寬泛的一類資料結構。” 維基百科中更準確地給出了PGM的定義：“A graphical model or probabilistic graphical model is a probabilistic model for which a graph expresses the conditional dependence structure between random variables. ” 如果你已經掌握了貝葉斯網路，那麼你一定不會對PGM的概念感到陌生。本文將要向你介紹另外一種型別的PGM，即隱馬爾可夫模型（HMM，Hidden Markov Model）。更準確地說，HMM是一種特殊的貝葉斯網路。

一些必備的數學知識

隨機過程（Stochastic Process）是一連串隨機事件動態關係的定量描述。如果用更為嚴謹的數學語言來描述，則有：設對每一個 t∈T，X(t,w) 是一個隨機變數，稱隨機變數族 XT={X(t,w),t∈T} 為一隨機過程（或隨機函式），其中 T∈ℝ 稱為指標集，ℝ 是實數集。w∈Ω，Ω為樣本空間。用對映來表示XT，

X(t,w)：T×Ω→ℝ
即 X(⋅,⋅) 是定義在 T×Ω 上的二元單值函式。其中 T×Ω 表示 T 和 Ω 的笛卡爾積。

引數 t∈T 一般表示時間。當 T 取可列集時，通常稱 XT 為隨機序列。XT(t∈T) 可能取值的全體集合稱為狀態空間，狀態空間中的元素稱為狀態。

馬爾科夫過程（Markov Process）是本文中我們所要關注的一種隨機過程。粗略地說，一個隨機過程，若已知現在的 t 狀態 Xt, 那麼將來狀態 Xu(u>t) 取值（或取某些狀態）的概率與過去的狀態 Xs(s>t) 取值無關；或者更簡單地說，已知現在、將來與過去無關（條件獨立），則稱此過程為馬爾科夫過程。

同樣，我們給出一個精確的數學定義如下：若隨機過程{Xt,t∈T}對任意 t1<t2<…<tn<t，xi，1≤i≤n 及 A 是 ℝ 的子集，總有

P{Xt∈A|Xt1=x1,Xt2=x2,⋯,Xtn=xn}=P{Xt∈A|Xtn=xn}
則稱此過程為馬爾科夫過程。稱P

(s,x;t,A)=P{Xt∈A|Xs=x}，s>t, 為轉移概率函式。Xt 的全體取值構成集合 S 就是狀態空間。對於馬爾可夫過程 XT={Xt,t∈T}，當S={1,2,3,⋯}為可列無限集或有限集時，通常稱為馬爾科夫鏈（Markov Chain）。

從時間角度考慮不確定性

在前面給出的貝葉斯網路例子中，每一個隨機變數都有唯一的一個固定取值。當我們觀察到一個結果或狀態時（例如Mary給你打電話），我們的任務是據此推斷此時發生地震的概率有多大。而在此過程中，Mary是否給你打過電話這個狀態並不會改變，而地震是否已經發生也不會改變。這就說明，我們其實是在一個靜態的世界中來進行推理的。

但是我們現在要研究的HMM，其本質則是基於一種動態的情況來進行推理，或者說是根據歷史來進行推理。假設要為一個高血壓病人提供治療方案，醫生每天為他量一次血壓，並根據這個血壓的測量值調配用藥的劑量。顯然，一個人當前的血壓情況是跟他過去一段時間裡的身體情況、治療方案，飲食起居等多種因素息息相關的，而當前的血壓測量值相等於是對他當時身體情況的一個“估計”，而醫生當天開具的處方應該是基於當前血壓測量值及過往一段時間裡病人的多種情況綜合考慮後的結果。為了根據歷史情況評價當前狀態，並且預測治療方案的結果，我們就必須對這些動態因素建立數學模型。

而隱馬爾科夫模型就是解決這類問題時最常用的一種數學模型，簡單來說，HMM是用單一離散隨機變數描述過程狀態的時序概率模型。HMM的基本模型可用下圖來表示，其中塗有陰影的圓圈 yt−2,yt−1,yt 相當於是觀測變數，空白圓圈 xt−2,xt−1,xt 相當於是隱變數。回到剛剛提及的高血壓治療的例子，你所觀測到的狀態（例如血壓計的讀數）相當於是對其真實狀態（即病人的身體情況）的一種估計（因為觀測的過程中必然存在噪聲），用數學語言來表述就是P(yt|xt)，這就是模型中的測量模型或測量概率（Measurement Probability）。另外一方面，當前的（真實）狀態（即病人的實際身體狀況）應該與其上一個觀測狀態相關，即存在這樣的一個分佈P(

機器學習中的隱馬爾科夫模型（HMM）詳解

引言

一些必備的數學知識

從時間角度考慮不確定性

機器學習中的隱馬爾科夫模型（HMM）詳解

隱馬爾可夫模型（HMM）詳解

隱馬爾科夫模型（HMM）的學習筆記

隱馬爾科夫模型（HMM）學習筆記二

自然語言處理---用隱馬爾科夫模型（HMM）實現詞性標註---1998年1月份人民日報語料---learn---test---evaluation---Demo---java實現

隱馬爾科夫模型（HMM）與維特比（Viterbi）演算法通俗理解

[八]機器學習之隱馬爾科夫模型HMM

隱馬爾科夫模型（三）學習演算法

利用隱馬爾科夫鏈（HMM）模型實現中文分詞

隱馬爾科夫鏈（hmm）基本原理和簡單例項

隱馬爾科夫模型（四）預測演算法

隱馬爾科夫模型（二）

隱馬爾科夫模型（一）

隱馬爾科夫模型（HMM)——qjzcy的部落格

隱馬爾可夫模型（HMM）和 jieba分詞原始碼的理解

隱馬爾可夫模型（HMM）及Viterbi演算法

HMM隱馬爾可夫模型（HMM）攻略

隱馬爾可夫模型（HMM）和Viterbi演算法

隱馬爾可夫模型（HMM）攻略

隱馬爾可夫模型（HMM）

機器學習中的隱馬爾科夫模型（HMM）詳解

引言

一些必備的數學知識

從時間角度考慮不確定性

相關推薦