N 表示隱藏狀態的數量，我們要麼知道確切的值，要麼猜測該值；
M 表示可觀測狀態的數量，可以通過訓練集獲得；
π={πi} 為初始狀態概率；代表的是剛開始的時候各個隱藏狀態的發生概率；
A={aij}為隱藏狀態的轉移概率矩陣；NN，代表的是第一個狀態到第二個狀態發生的概率；
B={bij}為發射概率矩陣，NM，代表的是處於某個隱狀態的條件下，某個觀測發生的概率。

以比較通俗的例子，你只能往地上看花，花有{旺盛，蔫}兩種狀態，這是觀測狀態，如果假設花的狀態只和天氣有關，並且進行簡化，那麼{下雨，晴天，陰天}就是這個觀測狀態對應的隱藏狀態，其中

HMM可以解決的問題

模型評估問題（概率計算問題）

知道觀測序列，知道隱藏序列，π，A，B，求解得到該觀測序列的概率

最簡單的例子，我用一個六面骰骰一次，骰出了1，求骰出1的概率（1/6）。這時隱藏序列是<六面骰>，觀測序列是<1>

解決方案： 窮舉（不推薦），前向/後向演算法

解碼問題（預測問題）

知道觀測序列，知道隱藏狀態的集合以及π，A，B，預測最大可能的隱藏序列

最簡單的例子，我知道我骰了<1>，我想知道我用的最有可能是六面骰還是四面骰（答案是四面骰，因為四面骰的概率是1/4，而六面骰的概率是1/6）。
解決方案： Viterbi演算法

引數評估問題（屬於非監督學習演算法）

知道觀測序列，知道隱藏狀態的集合，求π，A，B，使得當前觀測序列發生的可能性最大
解決方案： EM演算法，Baum—Welch演算法

注意，所有的解決方案都不唯一，而且解決方案中的方法也並不僅僅侷限於解決這個問題，這些解決方案只是針對模型提出的問題的解決

如果這裡對這些敘述覺得抽象，可以看一下這篇部落格的舉例 https://www.cnblogs.com/skyme/p/4651331.html

HMM的缺點

缺乏靈活性，兩個以上隱藏狀態決定的觀測值不能通過HMM求解

HMM的應用

N元語義

背景

如果我們統計過很多很多的文字，把其中每個字出現的次數都統計出來，那麼每個字出現的頻率就等於概率。
現在我說一句話：我去北京大學玩，求這句話出現的概率是多少

求解辦法： 因為我們知道了每個字出現的概率，那麼：
$P(我去北京大學玩)=P(我)*P(去|我)*P(北|我去)...*P(玩|我去北京大學)$

如果句子一多，那麼求解到後面的字會變得非常麻煩。這個時候就有人提出了N元語義

簡要介紹

如"我去北京大學玩"中，我們認為"玩"這個字和"我"是否出現並沒有太大的關係，因為完全可以"他去北京大學玩"，因此，就可以假設一個字出現只和其上文有限個字的出現有關。

換而言之，我們認為"玩"應該只和"去"或者只和"大學去"有關（假設，不一定真的有關），也就是
$P(玩|我去北京大學) \approx P(玩|去)$

其中，如果認為"玩"只和"去"有關(即前一個文字)，那麼就是二元語義，即一階馬爾可夫模型；如果是N元語義(和前N-1個文字有關)，那麼就是N-1階馬爾可夫模型

BMES標註預測

BMES是語義的標註，其中B=Begin，M=Medium，E=End，S=Single，分別代表一個字在詞中的地位（開始，中間，結束，S代表單字成詞），我們要句子進行BMES的標註。
在HMM中，BMES即為隱狀態的型別，而句子中的每個字，則是觀測狀態。

同時基於語料的分析，我們能夠得到轉移概率，初始概率，發射概率，因此對句子進行BMES標註的方法之一就是採用隱馬爾可夫模型。

如果有用過jieba分詞或者感興趣的話，可以看一下cut()方法中呼叫的_cut_DAG的實現，對未登入詞，jieba是採用Viterbi演算法對其進行了BMES標註後進行切分的，而概率則是jieba分詞中預先計算好並寫在庫中的文字。

HMM知識點整合與理解

文章目錄

基本概念

隱馬爾可夫模型（HMM）

HMM可以解決的問題

模型評估問題（概率計算問題）

解碼問題（預測問題）

引數評估問題（屬於非監督學習演算法）

HMM的缺點

HMM的應用

N元語義

背景

簡要介紹

BMES標註預測

HMM知識點整合與理解

【工程化知識點】淺談持續整合與灰度釋出

.NET Core 3.0之深入原始碼理解Kestrel的整合與應用(一)

.NET Core 3.0之深入原始碼理解Kestrel的整合與應用(二)

ui自動化測試的意義與理解

【Docker江湖】之docker部署與理解

JDK部分源碼閱讀與理解

JTA的使用與理解

Myibaits的學習與理解，使用

checkbox復選框的一些深入研究與理解（張）

java中容器的學習與理解

扒一扒offsetleft，srollleft，pagex，clientx，postion().left等精確位置的獲取與理解

Oracle sequence的基本概念與理解

「4+1視圖」學習與理解

關於RAM與ROM的區別與理解

數據庫的DDL、DML和DCL的區別與理解

vue - 生命周期第二次學習與理解

MDM-Object.fn 一些實踐與理解

Python爬蟲知識點——Session與Cookie

對Java對象的認識與理解

HMM知識點整合與理解

文章目錄

基本概念

隱馬爾可夫模型（HMM）

HMM可以解決的問題

模型評估問題（概率計算問題）

解碼問題（預測問題）

引數評估問題（屬於非監督學習演算法）

HMM的缺點

HMM的應用

N元語義

背景

簡要介紹

BMES標註預測

相關推薦