1. 程式人生 > >Kaldi學習筆記(一)——Kaldi的下載安裝與編譯

Kaldi學習筆記(一)——Kaldi的下載安裝與編譯

Kaldi是一款基於C++編寫的開源語音識別工具箱。這款工具既可以在Windows下編譯也可以在Linux下編譯。本次我是在虛擬機器裝上了Ubuntu 16.04.03,64位,可以聯網。文件裡面也說還是建議在Linux下使用Kaldi。

一、下載

下載直接利用git版本控制系統就可以了,開啟終端,直接在你的實驗目錄下輸入命令:

git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden

不一會就從github上下載下來了。當然,首先得確保你安裝了git。要是沒安裝的話,就先輸入:

sudo apt-get install git


安裝git版本控制軟體。

二、各目錄功能

下載完畢以後,cd kaldi-trunk進去看看下載了一些什麼東西。 

其中,./tools,./src和./egs這三個目錄是比較重要的。

./tools目錄下面全部都是Kaldi依賴的包。其中主要有:

  1. OpenFST:Weighted Finite State Transducer library,是一個用來構造有限狀態自動機的庫。我們知道隱馬爾科夫模型就可以看成是一個有限狀態自動機的。這是最終要的一個包,Kaldi的文件裡面說:If you ever want to understand Kaldi deeply you will need to understand OpenFst.
  2. ATLAS:這是一個C++下的線性代數庫。做機器學習自然是需要很多矩陣運算的。
  3. IRSTLM:這是一個統計語言模型的工具包。
  4. sph2pipe:這是賓夕法尼亞大學linguistic data consortium(LDC)開發的一款處理SPHERE_formatted數字音訊檔案的軟體,它可以將LDC的sph格式的檔案轉換成其它格式。

./src目錄存放的是Kaldi的原始碼

./egs存放的是Kaldi提供的一些例子。我們現在要做的就是編譯安裝Kaldi依賴的各種庫,然後編譯安裝Kaldi。

三、Kaldi的編譯

安裝之前需要確保你安裝了這些軟體:

apt-get
subversion
automake
autoconf
libtool
g++
zlib
libatal
wget


安裝方法為在shell裡輸入:

sudo apt-get install subversion
sudo apt-get install automake
sudo apt-get install autoconf
sudo apt-get install libtool
sudo apt-get install g++
sudo apt-get install wget
sudo apt-get install libatlas-dev
sudo apt-get install libatlas-base-dev
sudo apt-get install zlib1g
sudo apt-get install zlib1g-dev 

1.在./tool目錄下輸入make,開始編譯,輸入make -j 4命令可以加快速度(多核並行處理)。 
2.之後切換到./src目錄下,輸入./configure進行配置,然後輸入make all進行編譯。當然這個過程也可以並行處理加速,輸入make -j 4。經過漫長的編譯過程以後,就安裝完畢了。