(四)N-gram語言模型與馬爾科夫假設

1、從獨立性假設到聯合概率鏈

樸素貝葉斯中使用的獨立性假設為

\begin{matrix} (1) & P (x_{1}, x_{2}, x_{3}, . . ., x_{n}) = P (x_{1}) P (x_{2}) P (x_{3}) . . . P (x_{n}) \end{matrix}

$P(x_1,x_2,x_3,...,x_n)=P(x_1)P(x_2)P(x_3)...P(x_n) \tag{1}$
去掉獨立性假設，有下面這個恆等式，即聯合概率鏈規則

\begin{matrix} (2) & P (x_{1}, x_{2}, x_{3}, . . ., x_{n}) = P (x_{1}) P (x_{2} | x_{1}) P (x_{3} | x_{1}, x_{2}) . . . P (x_{n} | x_{1}, x_{2}, . . ., x_{n - 1}) \end{matrix}

$P(x_1,x_2,x_3,...,x_n)=P(x_1)P(x_2|x_1)P(x_3|x_1,x_2)...P(x_n|x_1,x_2,...,x_{n-1}) \tag{2}$
其中，

x_{i}

$x_i$ 代表一個詞，聯合概率鏈規則表示句子中每個詞都跟前面一個詞有關，而獨立性假設則是忽略了一個句子中詞與詞之間的前後關係。

2、從聯合概率鏈規則到n-gram語言模型

聯合概率鏈規則是考慮了句子中每個詞之間的前後關係，即第n個詞 $x_n$ 與前面 $n-1$ 個詞 $x_1,x_2,..,x_{n-1}$ 有關，而n-gram語言模型模型則是考慮了n個詞語之間的前後關係，比如 $n=2$ 時（二元語法（bigram，2-gram）），第n個詞 $x_n$ 與前面 $2-1=1$ 個詞有關，即

\begin{matrix} (3) & P (x_{1}, x_{2}, x_{3}, . . ., x_{n}) = P (x_{1}) P (x_{2} | x_{1}) P (x_{3} | x_{2}) . . . P (x_{n} | x_{n - 1}) \end{matrix}

$P(x_1,x_2,x_3,...,x_n)=P(x_1)P(x_2|x_1)P(x_3|x_2)...P(x_n|x_{n-1}) \tag{3}$
比如

n = 3

$n=3$ 時（三元語法（trigram，3-gram）），第n個詞

x_{n}

$x_n$ 與前面

3 - 1 = 2

$3-1=2$ 個詞有關，即

\begin{matrix} (4) & P (x_{1}, x_{2}, x_{3}, . . ., x_{n}) = P (x_{1}) P (x_{2} | x_{1}) P (x_{3} | x_{1}, x_{2}) . . . P (x_{n} | x_{n - 2}, x_{n - 1}) \end{matrix}

(四)N-gram語言模型與馬爾科夫假設

1、從獨立性假設到聯合概率鏈

2、從聯合概率鏈規則到n-gram語言模型

(四)N-gram語言模型與馬爾科夫假設

N-gram語言模型與馬爾科夫假設

機器學習 —— 概率圖模型（馬爾科夫與條件隨機場）

概率分布與馬爾科夫鏈的關系討論（上傳費事）

概率分布與馬爾科夫鏈的關系討論

漫話概率圖模型：馬爾科夫隨機場（MRF）

隨機遊走與馬爾科夫鏈的一些基礎

隱馬爾科夫模型與三個問題

自然語言處理---用隱馬爾科夫模型（HMM）實現詞性標註---1998年1月份人民日報語料---learn---test---evaluation---Demo---java實現

通俗理解N-gram語言模型。（轉）

n-gram語言模型及平滑演算法

隱馬爾科夫模型（HMM）與維特比（Viterbi）演算法通俗理解

(五)N-gram語言模型的資料處理

馬爾科夫模型與隱馬爾科夫模型

hmm前後向演算法隱馬爾科夫模型HMM（三）鮑姆-韋爾奇演算法求解HMM引數隱馬爾科夫模型HMM（四）維特比演算法解碼隱藏狀態序列隱馬爾科夫模型HMM（一）HMM模型

python自然語言處理-馬爾科夫模型

隱馬爾科夫模型（四）預測演算法

N-Gram語言模型

自然語言期末複習筆記—最大熵馬爾科夫模型MEMM

【線性代數公開課MIT Linear Algebra】第二十四課特徵值與特徵向量的應用——馬爾科夫矩陣、傅立葉級數

(四)N-gram語言模型與馬爾科夫假設

1、從獨立性假設到聯合概率鏈

2、從聯合概率鏈規則到n-gram語言模型

相關推薦