【NLP】揭祕馬爾可夫模型神祕面紗系列文章（二）

阿新 • • 發佈：2019-01-13

2016年7月11日15:31:11

摘要：最早接觸馬爾可夫模型的定義源於吳軍先生《數學之美》一書，起初覺得深奧難懂且無什麼用場。直到學習自然語言處理時，才真正使用到隱馬爾可夫模型，並體會到此模型的妙用之處。馬爾可夫模型在處理序列分類時具體強大的功能，諸如解決：詞類標註、語音識別、句子切分、字素音位轉換、區域性句法剖析、語塊分析、命名實體識別、資訊抽取等。另外廣泛應用於自然科學、工程技術、生物科技、公用事業、通道編碼等多個領域。本文寫作思路如下：第一篇對馬爾可夫個人簡介和馬爾科夫鏈的介紹；第二篇介紹馬爾可夫鏈（顯馬爾可夫模型）和隱馬爾可夫模型以及隱馬爾可夫模型的三大問題（似然度、編碼、引數學習）；第三至五篇逐一介紹三大問題相關演算法：（向前演算法、維特比演算法、向前向後演算法）；最後非常得益於馮志偉先生自然語言處理教程一書，馮老研究自然語言幾十餘載，在此領域別有建樹

。

馬爾可夫個人簡介

安德烈·馬爾可夫，俄羅斯人，物理-數學博士，聖彼得堡科學院院士，彼得堡數學學派的代表人物，以數論和概率論方面的工作著稱，他的主要著作有《概率演算》等。1878年，榮獲金質獎章，1905年被授予功勳教授稱號。馬爾可夫是彼得堡數學學派的代表人物。以數論和概率論方面的工作著稱。他的主要著作有《概率演算》等。在數論方面，他研究了連分數和二次不定式理論，解決了許多難題。在概率論中，他發展了矩陣法，擴大了大數律和中心極限定理的應用範圍。馬爾可夫最重要的工作是在1906～1912年間，提出並研究了一種能用數學分析方法研究自然過程的一般圖式——馬爾可夫鏈

。同時開創了對一種無後效性的隨機過程——馬爾可夫過程的研究。馬爾可夫經多次觀察試驗發現，一個系統的狀態轉換過程中第n次轉換獲得的狀態常取決於前一次（第（n-1）次）試驗的結果。馬爾可夫進行深入研究後指出：對於一個系統，由一個狀態轉至另一個狀態的轉換過程中，存在著轉移概率，並且這種轉移概率可以依據其緊接的前一種狀態推算出來，與該系統的原始狀態和此次轉移前的馬爾可夫過程無關。馬爾可夫鏈理論與方法在現代已經被廣泛應用於自然科學、工程技術和公用事業中。

1 引言

當需要計算現實世界上可以直接觀察到的時間序列的概率時，（如上面天氣事件），馬爾可夫鏈很有用。但是，當我們處理的事件是現實世界不能觀察到的，而是隱含在觀察背後，諸如詞類標註（根據具體的一個個的詞，我們實現看到的詞的序列去標註出正確的詞類，此事詞類的標註是隱藏的）、語音識別（聲學事件下，推斷出隱藏在其背後的單詞）等。類似這樣的事件馬爾可夫鏈是不能直接解決的，此處隱馬爾可夫模型便派到用場。

隱馬爾科夫模型：由被觀察到的事件（如：此類標記時我們輸入中看到的詞序列），又涉及到隱藏事件（對詞的標註），這些隱藏事件在概率模型中被我們認為是引導因素。

2 隱馬爾可夫模型

2.1 愛依斯訥（Jason Eisner）對隱馬爾可夫模型的描述

隱馬爾可夫模型在現實問題中應用：

隱馬爾可夫模型在現實事件中的使用，假設從2016年之後的一千年（3016年），我們想了解2016年某段時間中國*成都天氣狀況（假設簡單的熱冷表示即H|C），恰巧又沒有2016年成都天氣關於熱冷的記錄，唯一的線索便是小明日記本中夏天的一段記錄，記錄的是每天小明吃冰淇淋的數量（觀察狀態），我們可以利用隱馬爾可夫模型根據小明夏天吃冰淇淋數量的記錄推斷中國成都天氣（熱=0.8|冷=0.2，即隱含狀態），究竟該如何做？

（1）具有初始狀態和終結狀態的隱馬爾科夫鏈描述如下：

（2）沒有初始狀態和終結狀態的隱馬爾科夫鏈描述如下：

（3）一階隱馬爾可夫的兩個假設

2.2 拉賓納（Rabiner）對隱馬爾可夫模型思想的三個問題

問題1（似然度問題）：給一個HMM λ=（A,B）和一個觀察序列O，確定觀察序列的似然度問題 P(O|λ) 。

問題2（解碼問題）：給定一個觀察序列O和一個HMM λ=（A,B），找出最好的隱藏狀態序列Q。

問題3（學習問題）：給定一個觀察序列O和一個HMM中的狀態集合，自動學習HMM的引數A和B。

如上的冰淇淋事件是典型的問題1，似然度問題，對應向前演算法解決。詞類標註是典型問題2解碼問題，對應維特比演算法解決。問題3是機器學習問題，對應向前向後演算法解決。此三個問題稍後篇章會一一介紹。

3 案例解析隱馬爾可夫模型

下圖描述小明吃冰淇淋的數量（觀察值）與天氣熱冷情況（隱藏值H或C）之間的隱馬爾可夫模型

其中hot1的轉移概率是：

P（1|hot）=0.2 夏天某天天氣熱吃1根冰淇淋的概率

P（2|hot）=0.4 夏天某天天氣熱吃2根冰淇淋的概率

P（3|hot）=0.4 夏天某天天氣熱吃3根冰淇淋的概率

其中cold2的轉移概率是：

P（1|hot）=0.5 夏天某天天氣冷吃1根冰淇淋的概率

P（1|hot）=0.4 夏天某天天氣冷吃2根冰淇淋的概率

P（1|hot）=0.1 夏天某天天氣冷吃3根冰淇淋的概率

其中觀察值（吃的數量）：

O={1,2,3}

隱藏值（天氣的狀態）：

S={H,C}

全連通HMM：任何兩個狀態之間的轉移一個非零概率。

非全連通HMM：從左到右的單向序列，如對語音程序建模。

通過小明吃冰淇淋的觀察值推斷天氣狀態的問題，留著下節採用隱含馬爾可夫模型解決。此處採用一個短小簡明的例子，旨在讓讀者明白原理，後續會拿到現實應用中深入講解。

4 參考文獻

【1】統計自然語言處理基礎 Christopher.Manning等著宛春法等譯

【2】自然語言處理簡明教程馮志偉著

【3】數學之美吳軍著

【4】Viterbi演算法分析文章王亞強

宣告：關於此文各個篇章，本人採取梳理扼要，順暢通明的寫作手法。一則參照相關資料二則根據自己理解進行梳理。避免冗雜不清，每篇文章讀者可理清核心知識，再找相關文獻系統閱讀。另外，要學會舉一反三，不要死盯著定義或者某個例子不放。諸如：此文章例子冰淇淋數量（觀察值）與天氣冷熱（隱藏值）例子，讀者不免問道此有何用？我們將冰淇淋數量換成中文文字或者語音（觀察序列），將天氣冷熱換成英文文字或者語音文字（隱藏序列）。把這個問題解決了不就是解決了文字翻譯、語音識別、自然語言理解等等。解決了自然語言的識別和理解，再應用到現在機器人或者其他裝置中，不就達到實用和聯絡現實生活的目的了？

【NLP】揭祕馬爾可夫模型神祕面紗系列文章（二）

目錄

馬爾可夫個人簡介

1 引言

2 隱馬爾可夫模型

2.1 愛依斯訥（Jason Eisner）對隱馬爾可夫模型的描述

2.2 拉賓納（Rabiner）對隱馬爾可夫模型思想的三個問題

3 案例解析隱馬爾可夫模型

4 參考文獻

【NLP】揭祕馬爾可夫模型神祕面紗系列文章（二）

【NLP】揭祕馬爾可夫模型神祕面紗系列文章（一）

【NLP】揭祕馬爾可夫模型神祕面紗系列文章（三）

【NLP】揭祕馬爾可夫模型神祕面紗系列文章（五）

【NLP】揭祕馬爾可夫模型神祕面紗系列文章（四）

【NLP】驀然回首：談談學習模型的評估系列文章（二）

【NLP】驀然回首：談談學習模型的評估系列文章（三）

【NLP】驀然回首：談談學習模型的評估系列文章（一）

【演算法】隱馬爾可夫模型 HMM

【機器學習筆記18】隱馬爾可夫模型

【中文分詞】隱馬爾可夫模型HMM

NLP之隱馬爾可夫模型

【統計學習方法-李航-筆記總結】十、隱馬爾可夫模型

【中文分詞】二階隱馬爾可夫模型2-HMM

【中文分詞】最大熵馬爾可夫模型MEMM

NLP-隱馬爾可夫模型及使用例項

隱馬爾可夫模型（三）

隱馬爾可夫模型（一）

簡單馬爾可夫模型的實現（簡單的機器學習）

轉：從頭開始編寫基於隱含馬爾可夫模型HMM的中文分詞器

【NLP】揭祕馬爾可夫模型神祕面紗系列文章（二）

目錄

馬爾可夫個人簡介

1 引言

2 隱馬爾可夫模型

2.1 愛依斯訥（Jason Eisner）對隱馬爾可夫模型的描述

2.2 拉賓納（Rabiner）對隱馬爾可夫模型思想的三個問題

3 案例解析隱馬爾可夫模型

4 參考文獻

相關推薦