語音識別語言模型和拼音字典檔案製作
阿新 • • 發佈:2019-01-04
接我前面的文章,下載 pocketsphinx 和 中文模型檔案。
由於模型檔案格式有一些要求,所以建議對模型檔案的編輯都在Linux上完成。
準備中文語言檔案
建立一個文字檔案 my.txt,內容如下:
測試
直走
左轉
右轉
後退
開火
靠嘍
生成語音模型檔案和字典檔案
訪問 http://www.speech.cs.cmu.edu/tools/lmtool-new.html 頁面,上傳 my.txt 檔案,然後使用“COMPILE KNOWLEDGE BASE”來生成模型檔案。
在生成的列表頁面,下載最下面的那個 TAR<???>.tgz,檔名是動態產生的,這裡我生成的檔名為:TAR2007.tgz。
下載之。
解壓之。
編輯其下的 2007.dic 檔案,參考 zh_broadcastnews_utf8.dic 檔案加入拼音,比如:
右轉 y ou zh uan
後退 h ou t ui
左轉 z uo zh uan
開火 k ai h uo
測試 c e sh ib
前進 q ian j in
靠嘍 k ao l ou
測試
使用 pocketsphinx_continuous 工具測試,這裡使用了一個我提前錄製好的音訊檔案來做測試,其中引數路徑根據自己具體檔案位置修改。
pocketsphinx_continuous -hmm test/zh_broadcastnews_ptm256_8000 -lm test/TAR2007/2007.lm -dict test/TAR2007/2007.dic -infile test/small.wav