1. 程式人生 > >(四)N-gram語言模型與馬爾科夫假設

(四)N-gram語言模型與馬爾科夫假設

1、從獨立性假設到聯合概率鏈

樸素貝葉斯中使用的獨立性假設為

(1) P (
x 1 , x 2 , x 3
, . . . , x n ) = P
( x 1 ) P ( x 2 ) P ( x 3 ) . . . P ( x n )

去掉獨立性假設,有下面這個恆等式,即聯合概率鏈規則
(2) P ( x 1 , x 2 , x 3 , . . . , x n ) = P ( x 1 ) P ( x 2 | x 1 ) P ( x 3 | x 1 , x 2 ) . . . P ( x n | x 1 , x 2 , . . . , x n 1 )
其中, x i 代表一個詞,聯合概率鏈規則表示句子中每個詞都跟前面一個詞有關,而獨立性假設則是忽略了一個句子中詞與詞之間的前後關係。

2、從聯合概率鏈規則到n-gram語言模型

聯合概率鏈規則是考慮了句子中每個詞之間的前後關係,即第n個詞 x n 與前面 n 1 個詞 x 1 , x 2 , . . , x n 1 有關,而n-gram語言模型模型則是考慮了n個詞語之間的前後關係,比如 n = 2 時(二元語法(bigram,2-gram)),第n個詞 x n 與前面 2 1 = 1 個詞有關,即

(3) P ( x 1 , x 2 , x 3 , . . . , x n ) = P ( x 1 ) P ( x 2 | x 1 ) P ( x 3 | x 2 ) . . . P ( x n | x n 1 )
比如 n = 3 時(三元語法(trigram,3-gram)),第n個詞 x n 與前面 3 1 = 2 個詞有關,即
(4) P ( x 1 , x 2 , x 3 , . . . , x n ) = P ( x 1 ) P ( x 2 |