1. 程式人生 > >語音識別語言模型和拼音字典檔案製作

語音識別語言模型和拼音字典檔案製作

接我前面的文章,下載 pocketsphinx 和 中文模型檔案。

由於模型檔案格式有一些要求,所以建議對模型檔案的編輯都在Linux上完成。

準備中文語言檔案

建立一個文字檔案 my.txt,內容如下:

測試
直走
左轉
右轉
後退
開火
靠嘍

生成語音模型檔案和字典檔案

訪問 http://www.speech.cs.cmu.edu/tools/lmtool-new.html 頁面,上傳 my.txt 檔案,然後使用“COMPILE KNOWLEDGE BASE”來生成模型檔案。
在生成的列表頁面,下載最下面的那個 TAR<???>.tgz,檔名是動態產生的,這裡我生成的檔名為:TAR2007.tgz。

下載之。

解壓之。

編輯其下的 2007.dic 檔案,參考 zh_broadcastnews_utf8.dic 檔案加入拼音,比如:

右轉 y ou zh uan
後退 h ou t ui
左轉 z uo zh uan
開火 k ai h uo
測試 c e sh ib
前進 q ian j in
靠嘍 k ao l ou

測試

使用 pocketsphinx_continuous 工具測試,這裡使用了一個我提前錄製好的音訊檔案來做測試,其中引數路徑根據自己具體檔案位置修改。

pocketsphinx_continuous -hmm test/zh_broadcastnews_ptm256_8000 -lm test/TAR2007/2007.lm -dict test/TAR2007/2007.dic -infile test/small.wav