1. 程式人生 > >N-Gram 演算法用來做相似度比較

N-Gram 演算法用來做相似度比較

N-Gram 模型基於這樣一種假設,第n個詞的出現只與前面n-1個詞相關,而與其它任何詞都不相關,整句的概率就是各個詞出現概率的乘積。在拼寫檢查裡即是一個字母的出現概率只和前n-1個字母的出現概率相關,並且是前n-1個字母出現概率的乘積。