1. 程式人生 > >IOS Android 和 Unity上基於kaldi的離線語音識別系統

IOS Android 和 Unity上基於kaldi的離線語音識別系統

在一些教育 醫療產業中, 很多的詞彙都非常專業, 並不是一般的語音識別系統所能提供服務的, 這時就需要我們自己構建一個離線的可以在手機或者平板上執行的語音識別系統, 我選擇的是Kaldi, 因為Kaldi的識別能力要比上一代的CMU SPHINX高很多, WER(錯誤識別率)能做到2%以下, 而且提供基於神經網路系統的模型訓練。

要把kaldi做到手機基本的步驟是:

1 把kaldi的所有庫編譯成移動平臺能夠使用的架構(armv7 和 arm64)

2  掌握構建語音識別系統的順序,訓練語音模型和語言模型

3  學會使用kaldi的類構建語音識別系統

由於程式碼仍在改進中,只能提供一些思路,如果希望有進一步的合作可以聯絡

[email protected]

=================================== update ========================================

由於受到一些大家的郵件, 所以更新一下

程式碼已經和一家公司合作, 所以不好意思,不能分享了, 但是技術上的討論還是可以的, 回答幾個小問題:

1. 我是編譯了兩個庫 一個kaldi.a 一個 openfst.a 我這裡是針對ios 平臺的

2. 做的時候注意kaldi的版本 kaldi 5.0 之前應該是不支援c11, 5.0之後支援了 所以編譯的時候會有影響

3. 編譯的時候,碰到最多的就是linker error,主要是老闆的kaldi 支援 libstdc++, 但是新版的xcode不支援了,全面改libc++了, 所以在編譯kaldi和openfst的庫的時候一定要注意,不然用不了

主要是這幾個問題,有其他問題還是可以聯絡我的郵箱或者在帖子下面留言