1. 程式人生 > >kaldi使用訓練好的模型做語音識別

kaldi使用訓練好的模型做語音識別

關於模型的訓練這裡就不寫了,網上搜thchs30資料有很多,關鍵說一下如果使用訓練好的模型

大體的過程參考這裡:https://www.2cto.com/kf/201706/651060.html

上面的步驟基本是正確的,但是有一個關鍵點有問題,就是run.sh檔案的修改上,對於live所對應的命令,修改方式應該為:

online-wav-gmm-decode-faster --rt-min=0.3 --rt-max=0.5 --max-active=    4000 --beam=12.0 --acoustic-scale=0.0769 scp:$decode_dir/input.scp $ac_model    /final.mdl $ac_model/HCLG.fst $ac_model/words.txt '1:2:3:4:5' ark,t:work/tra    ns.txt ark,t:work/ali.txt;;

online-gmm-decode-faster:識別從麥克風輸入的語音

online-wav-gmm-decode-faster:識別指定的wav檔案(通常我們都是遠端使用虛機,所以使用這個)