1.上下文對音素髮音的語譜軌跡的影響
受到上下文的影響,同一個音素的發音語譜軌跡不同
為提高識別準確率,對音素建模時應將這種上下文影響考慮在內
2.基於上下文相關的音素建模
注意,非單音素建模中,每個模型依舊代表一個音素,只是考慮了這個音素的上下文關係而已
1)雙音素diphones
考慮上個音素/下個音素對當前音素的影響
對於ROCK:
兩個??分別取決於ROCK的前一個單詞的最後一個音素和後一個單詞的第一個音素
灰色的邊界單元為鄰近單詞所共享
為語法/詞序列中觀察到的前後音素的每個組合構建單獨的基於雙音素的單詞模型
有時候,根據語法,同一個單詞的不同模型的部分可以重疊
由於邊界單元為鄰近單詞所共享,所以不再具有明確識別出的單詞級HMM
無法區分哪些雙音素是詞內,哪些是跨詞---單詞邊界不明確
因此可區分對待詞內雙音素與跨詞雙音素---共2xNxN個模型(N為單音素個數)
分別用詞內訓練資料和跨詞訓練資料進行訓練
2)三音素triphones
考慮上個音素和下個音素對當前音素的影響
與雙音素不同,不存在跨詞共享的邊界單元
與雙音素相同,??與前一個音素和後一個音素相關,同一個單詞對應多個單詞模型
有時候,根據語法,出現部分重疊
三音素的情況變得更為複雜:
模型數更多,搜尋更慢
基於單音素
基於三音素
3)多音素nphones
4)單音素vs雙音素vs三音素vs多音素
3.基於上下文相關的聲學模型訓練