1. 程式人生 > >【NLP】揭祕馬爾可夫模型神祕面紗系列文章(一)

【NLP】揭祕馬爾可夫模型神祕面紗系列文章(一)

作者:白寧超

2016年7月10日20:34:20

摘要:最早接觸馬爾可夫模型的定義源於吳軍先生《數學之美》一書,起初覺得深奧難懂且無什麼用場。直到學習自然語言處理時,才真正使用到隱馬爾可夫模型,並體會到此模型的妙用之處。馬爾可夫模型在處理序列分類時具體強大的功能,諸如解決:詞類標註、語音識別、句子切分、字素音位轉換、區域性句法剖析、語塊分析、命名實體識別、資訊抽取等。另外廣泛應用於自然科學、工程技術、生物科技、公用事業、通道編碼等多個領域。本文寫作思路如下:第一篇對馬爾可夫個人簡介和馬爾科夫鏈的介紹;第二篇介紹馬爾可夫鏈(顯馬爾可夫模型)和隱馬爾可夫模型以及隱馬爾可夫模型的三大問題(似然度、編碼、引數學習);第三至五篇逐一介紹三大問題相關演算法:(向前演算法、維特比演算法、向前向後演算法

);最後非常得益於馮志偉先生自然語言處理教程一書,馮老研究自然語言幾十餘載,在此領域別有建樹。

目錄

【自然語言處理:馬爾可夫模型(一)】:

1 馬爾可夫個人簡介

安德烈·馬爾可夫,俄羅斯人,物理-數學博士,聖彼得堡科學院院士,彼得堡數學學派的代表人物,以數論和概率論方面的工作著稱,他的主要著作有《概率演算》等。1878年,榮獲金質獎章,1905年被授予功勳教授稱號。馬爾可夫是彼得堡數學學派的代表人物。以數論和概率論方面的工作著稱。他的主要著作有《概率演算》等。在數論方面,他研究了連分數和二次不定式理論 ,解決了許多難題 。在概率論中,他發展了矩陣法,擴大了大數律和中心極限定理的應用範圍。馬爾可夫最重要的工作是在1906~1912年間,提出並研究了一種能用數學分析方法研究自然過程的一般圖式——馬爾可夫鏈。同時開創了對一種無後效性的隨機過程——馬爾可夫過程的研究。馬爾可夫經多次觀察試驗發現,一個系統的狀態轉換過程中第n次轉換獲得的狀態常取決於前一次(第(n-1)次)試驗的結果。馬爾可夫進行深入研究後指出:對於一個系統,由一個狀態轉至另一個狀態的轉換過程中,存在著轉移概率,並且這種轉移概率可以依據其緊接的前一種狀態推算出來,與該系統的原始狀態和此次轉移前的馬爾可夫過程無關。馬爾可夫鏈理論與方法在現代已經被廣泛應用於自然科學、工程技術和公用事業中。

2 馬爾可夫鏈

2.1  馬爾科夫鏈的基本概念

序列分類器:序列分類器或序列標號器是給序列中的某個單元指派類或者標號的模型。馬爾可夫模型(又叫顯馬爾可夫模型VMM)和隱馬爾可夫模型(HMM)都是序列分類器。諸如:詞類標註、語音識別、句子切分、字素音位轉換、區域性句法剖析、語塊分析、命名實體識別、資訊抽取都屬於序列分類。

【隨機過程的兩層含義】

(1)    隨機過程是一個時間函式,其隨著時間變化而變化

(2)    隨機過程的每個時刻上函式值是不確定的、隨機的,即每個時刻上函式值按照一定的概率進行分佈。

獨立鏈:隨機過程中各個語言符合或者詞是獨立的,不相互影響,則稱這種鏈是獨立鏈。反之,各語言詞或者符號彼此有關則是非獨立鏈。

等概率獨立鏈與非等概率獨立鏈:在獨立鏈中,各個語言符合或者詞是等概率出現的是等概率獨立鏈,各個語言詞或者語言符號是非等概率出現的則為非等概率鏈。

【馬爾可夫鏈】

馬爾可夫過程:在獨立鏈中,前面語言符號對後面的語言符號無影響,是無記憶沒有後效的隨機過程,在已知當前狀態下,過程的未來狀態與它的過去狀態無關,這種形式就是馬爾可夫過程。

馬爾可夫鏈:在隨機過程中,每個語言符號的出現概率不相互獨立,每個隨機試驗的當前狀態依賴於此前狀態,這種鏈就是馬爾可夫鏈。

鏈的解析:也可以當做一種觀察序列,諸如:“2016年是建黨95週年”,就可以看著一個字串鏈。其中如上字串中每個字元出現是隨機的,其他如果每個字出現是獨立的就是獨立鏈,如果每個字元出現有前面字元相關,即不獨立具有依賴性則為馬爾科夫鏈。

N元馬爾科夫鏈

考慮前一個語言符號對後一個語言符號出現概率的影響,這樣得出的語言成分的鏈叫做一重馬爾可夫鏈,也是二元語法。

考慮前兩個語言符號對後一個語言符號出現概率的影響,這樣得出的語言成分的鏈叫做二重馬爾可夫鏈,也是三元語法。

考慮前三個語言符號對後一個語言符號出現概率的影響,這樣得出的語言成分的鏈叫做三重馬爾可夫鏈,也是四元語法。

類似的,考慮前(4,5,….,N-1)個語言符號對後一個語言符號出現概率的影響,這樣得出的語言成分的鏈叫做(4,5,….,N-1)重馬爾可夫鏈,也是(5,6,….,N)元語法。

馬爾科夫鏈在數學上描述了自然語言句子的生成過程,是一個早期的自然語言形式的模型,後來N元語法的研究,都是建立在馬爾科夫模型的基礎上,馬爾科夫鏈也就是顯性的馬爾科夫模型,馬爾科夫鏈和隱馬爾科夫模型都是有限自動機(狀態集合狀態之間的轉移集)的擴充。

加權有限狀態機:加權有限狀態機中每個弧與一個概率有關,這個概率說明通過這個弧的可能性,且某一個點出發的弧具有歸一化的性質,即某點出發的弧概率之和為1。

注意:馬爾科夫鏈不能表示固有歧義的問題,當概率指派給沒有歧義時,馬爾科夫鏈才有用。

2.2  馬爾可夫鏈描述

(1)    具有初始狀態和終結狀態的馬爾科夫鏈描述如下:

(2)    沒有初始狀態和終結狀態的馬爾科夫鏈描述如下:

在一個一階馬爾可夫鏈中,我們假設一個特定的概率只與它前面一個狀態有關,馬爾可夫假設可以表示如下:

 

從一個狀態i出發的所有弧的概率之和為1,即:

 

2.3        馬爾可夫鏈應用例項

無初始狀態和終結狀態下,天氣事件(1)hot hot hot hot 和(2)cold hot cold hot的馬爾科夫鏈的序列概率:

   

(1)  hot hot hot hot =0.5*0.5*0.5*0.5=0.0625

(2)  cold hot cold hot=0.3*0.2*0.2*0.2=0.0024

如上概率差別告訴我們用馬爾科夫鏈編碼實現世界天氣事實是什麼?天氣事件的概率可以直接觀察到。

 3 參考文獻

【1】統計自然語言處理基礎  Christopher.Manning等 著    宛春法等 譯

【2】自然語言處理簡明教程  馮志偉 著

【3】數學之美  吳軍 著

【4】Viterbi演算法分析文章  王亞強

宣告:關於此文各個篇章,本人採取梳理扼要,順暢通明的寫作手法。一則參照相關資料二則根據自己理解進行梳理。避免冗雜不清,每篇文章讀者可理清核心知識,再找相關文獻系統閱讀。另外,要學會舉一反三,不要死盯著定義或者某個例子不放。諸如:此文章例子冰淇淋數量(觀察值)與天氣冷熱(隱藏值)例子,讀者不免問道此有何用?我們將冰淇淋數量換成中文文字或者語音(觀察序列),將天氣冷熱換成英文文字或者語音文字(隱藏序列)。把這個問題解決了不就是解決了文字翻譯、語音識別、自然語言理解等等。解決了自然語言的識別和理解,再應用到現在機器人或者其他裝置中,不就達到實用和聯絡現實生活的目的了?

相關推薦

NLP揭祕模型神祕面紗系列文章

作者:白寧超 2016年7月10日20:34:20 摘要:最早接觸馬爾可夫模型的定義源於吳軍先生《數學之美》一書,起初覺得深奧難懂且無什麼用場。直到學習自然語言處理時,才真正使用到隱馬爾可夫模型,並體會到此模型的妙用之處。馬爾可夫模型在處理序列分類時具體強大的功能,諸如解決:詞類標註、語音識別、句

NLP揭祕模型神祕面紗系列文章

作者:白寧超 2016年7月11日15:31:11 摘要:最早接觸馬爾可夫模型的定義源於吳軍先生《數學之美》一書,起初覺得深奧難懂且無什麼用場。直到學習自然語言處理時,才真正使用到隱馬爾可夫模型,並體會到此模型的妙用之處。馬爾可夫模型在處理序列分類時具體強大的功能,諸如解決:詞類標註、語音識別、句

NLP揭祕模型神祕面紗系列文章

作者:白寧超 2016年7月11日22:54:57 摘要:最早接觸馬爾可夫模型的定義源於吳軍先生《數學之美》一書,起初覺得深奧難懂且無什麼用場。直到學習自然語言處理時,才真正使用到隱馬爾可夫模型,並體會到此模型的妙用之處。馬爾可夫模型在處理序列分類時具體強大的功能,諸如解決:詞類標註、語音識別、句

NLP揭祕模型神祕面紗系列文章

作者:白寧超 2016年7月12日14:28:10 摘要:最早接觸馬爾可夫模型的定義源於吳軍先生《數學之美》一書,起初覺得深奧難懂且無什麼用場。直到學習自然語言處理時,才真正使用到隱馬爾可夫模型,並體會到此模型的妙用之處。馬爾可夫模型在處理序列分類時具體強大的功能,諸如解決:詞類標註、語音識別、句

NLP揭祕模型神祕面紗系列文章

作者:白寧超 2016年7月12日14:08:28 摘要:最早接觸馬爾可夫模型的定義源於吳軍先生《數學之美》一書,起初覺得深奧難懂且無什麼用場。直到學習自然語言處理時,才真正使用到隱馬爾可夫模型,並體會到此模型的妙用之處。馬爾可夫模型在處理序列分類時具體強大的功能,諸如解決:詞類標註、語音識別、句

NLP驀然回首:談談學習模型的評估系列文章

作者:白寧超 2016年7月18日17:18:43 摘要:寫本文的初衷源於基於HMM模型序列標註的一個實驗,實驗完成之後,迫切想知道採用的序列標註模型的好壞,有哪些指標可以度量。於是,就產生了對這一專題進度學習總結,這樣也便於其他人蔘考,節約大家的時間。本文依舊旨在簡明扼要梳理出模型評估核心指標,

NLP驀然回首:談談學習模型的評估系列文章

作者:白寧超 2016年7月19日19:04:51 摘要:寫本文的初衷源於基於HMM模型序列標註的一個實驗,實驗完成之後,迫切想知道採用的序列標註模型的好壞,有哪些指標可以度量。於是,就產生了對這一專題進度學習總結,這樣也便於其他人蔘考,節約大家的時間。本文依舊旨在簡明扼要梳理出模型評估核心指標,

NLP驀然回首:談談學習模型的評估系列文章

作者:白寧超 2016年7月19日10:24:24 摘要:寫本文的初衷源於基於HMM模型序列標註的一個實驗,實驗完成之後,迫切想知道採用的序列標註模型的好壞,有哪些指標可以度量。於是,就產生了對這一專題進度學習總結,這樣也便於其他人蔘考,節約大家的時間。本文依舊旨在簡明扼要梳理出模型評估核心指標,

演算法模型 HMM

隱馬爾可夫模型 (Hidden Markov Model,HMM) 以下來源於_作者 :skyme 地址:http://www.cnblogs.com/skyme/p/4651331.html 隱馬爾可夫模型(Hidden Markov Model,HMM)是統計模型,它用來描述一

機器學習筆記18模型

【參考資料】 【1】《統計學習方法》 隱馬爾可夫模型(HMM)定義 隱馬爾可夫模型: 隱馬爾可夫模型是關於時序的模型,描述一個由隱藏的馬爾可夫鏈生成的不可觀測的狀態序列,再由各個狀態生成的觀測值所構成的一個觀測序列。 形式化定義HMM為λ=(A,B,π)\la

中文分詞模型HMM

Nianwen Xue在《Chinese Word Segmentation as Character Tagging》中將中文分詞視作為序列標註問題(sequence tagging problem),由此引入監督學習演算法來解決分詞問題。 1. HMM 首先,我們將簡要地介紹HMM(主要參考了李航老師的《

NLP之隱模型

馬爾可夫模型 在介紹隱馬爾可夫模型之前,先來介紹馬爾可夫模型。 我們知道,隨機過程又稱隨機函式,是隨時間而隨機變化的過程。 馬爾可夫模型(Markov model)描述了一類重要的隨機過程。我們常常需要考察一個隨機變數序列,這些隨機變數並不是相互獨立的,每個隨機變數的值依賴於這個序

統計學習方法-李航-筆記總結十、隱模型

本文是李航老師《統計學習方法》第十章的筆記,歡迎大佬巨佬們交流。 主要參考部落格: https://www.cnblogs.com/YongSun/p/4767667.html https://www.cnblogs.com/naonaoling/p/5701634.html htt

中文分詞二階隱模型2-HMM

在前一篇中介紹了用HMM做中文分詞,對於未登入詞(out-of-vocabulary, OOV)有良好的識別效果,但是缺點也十分明顯——對於詞典中的(in-vocabulary, IV)詞卻未能很好地識別。主要是因為,HMM本質上是一個Bigram的語法模型,未能深層次地考慮上下文(context)。對於此,

中文分詞最大熵模型MEMM

Xue & Shen '2003 [2]用兩種序列標註模型——MEMM (Maximum Entropy Markov Model)與CRF (Conditional Random Field)——用於中文分詞;看原論文感覺作者更像用的是MaxEnt (Maximum Entropy) 模型而非MEM

NLP-隱模型及使用例項

說明:學習筆記,內容來自周志華的‘機器學習’書籍和加號的‘七月線上’視訊。 隱馬爾可夫模型 隱馬爾可夫模型(Hidden Markov Model,簡稱HMM)是結構最簡單的動態貝葉斯網,這是一種著名的有向圖模型,主要用於時序資料建模,在語音識別、

模型

image 之前 下標 如何 最大路 mage 局部最優 .com 紅色 預測算法 還記得隱馬爾可夫模型的三個問題嗎?本篇介紹第三個問題:預測問題,即給定模型參數和觀測序列,求最有可能的狀態序列,有如下兩種算法。 近似算法 在每個時刻t選出當前最有可能的狀態 it,從而得到

模型

回溯 一是 描述 數學 函數 觀測 tran 隱藏 之間 隱馬爾可夫模型   隱馬爾可夫模型(Hidden Markov Model,HMM)是一種統計模型,廣泛應用在語音識別,詞性自動標註,音字轉換,概率文法等各個自然語言處理等應用領域。經過長期發展,尤其

簡單模型的實現簡單的機器學習

自然語言 index 馬爾科夫 ref item model not 次數 read 馬爾可夫模型(Markov Model)是一種統計模型,廣泛應用在語音識別,詞性自動標註,音字轉換,概率文法等各個自然語言處理等應用領域。經過長期發展,尤其是在語音識別中的成功應用,使它成

轉:從頭開始編寫基於隱含模型HMM的中文分詞器

lan reverse single trim 地址 note str rip resources http://blog.csdn.net/guixunlong/article/details/8925990 從頭開始編寫基於隱含馬爾可夫模型HMM的中文分詞器之一 - 資