比起sge叢集的搭建配置,這個不算難,但還是有很多細節拖慢你的速度。已經重灌超過三次了,還是整理清楚記下來方便以後再要重灌吧!

1.安裝和配置

一個關鍵點就是:nvidia顯示卡的型別決定可以安裝哪些cuda的版本,而顯示卡驅動的版本又必須滿足cuda版本的要求!

1.1 安裝nvidia顯示卡驅動

1.2 安裝CUDA

  1.2.1 禁用nouveau(不禁用的話無法成功安裝)

cd /usr/lib/modprobe.d

vim dist-blacklist.conf

(新增:

blacklist nouveau

options nouveau modeset=0)

輸入init3切換模式,在root下繼續安裝

  1.2.3 配置環境及最終驗證

1.4 在kaldi中把CUDA編譯進去

kaldi/src目錄下:

make clean (這個很必要)

./configure

make all 

2.解除安裝顯示卡驅動和CUDA

如果倒騰過程中出現解決不了的問題,有時沒辦法只能解除安裝了重灌。

2.1 解除安裝CUDA

cd /usr/local/cuda-9.0/bin sudo ./uninstall_cuda_toolkit_9.0.pl 2.2 解除安裝顯示卡驅動

sh NVIDIA-Linux-x86-270.41.19.run --uninstall (得在NVIDIA-Linux-x86-270.41.19.run檔案所在目錄中執行該命令)