1. 程式人生 > >linux/Centos 安裝GTX-1080Ti 顯示卡 配置顯示卡驅動 cuda cudnn

linux/Centos 安裝GTX-1080Ti 顯示卡 配置顯示卡驅動 cuda cudnn

os: centos 6.9

顯示卡 :1080 TI

cuda :cuda-10.0

cudnn:cuDNN v 7.3.1

CentOS 6.9安裝NVIDIA GTX1080顯示卡驅動,直接說安裝步驟和遇到的問題:

一、安裝驅動

1:首先當然是要把驅動下載下來啦。我的電腦是NVIDIA的,所以自然先要訪問其官網:http://www.geforce.cn/drivers 根據你自己的顯示卡型號,選擇相應的顯示卡,進行下載勒,下載下來的是一個.run 的檔案。

2:OK,接下來就是安裝編譯環境:gcc、kernel-devel、kernel-headers  (當然,如果你的電腦已經安裝了,自然就不用在裝了)

1 # yum -y install gcc kernel-devel "kernel-devel-uname-r == $(uname -r)" dkms

"kernel-devel-uname-r == $(uname -r)"可以確保安裝與當前執行核心版本一樣的kernel-header

3:修改/etc/modprobe.d/blacklist.conf 檔案,以阻止 nouveau 模組的載入

方法: 新增blacklist nouveau,註釋掉blacklist nvidiafb(如果存在)

blacklist.conf不存在時,執行下面的指令碼

# echo -e "blacklist nouveau\noptions nouveau modeset=0" > /etc/modprobe.d/blacklist.conf

4:重新建立initramfs image檔案

# mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

# dracut /boot/initramfs-$(uname -r).img $(uname -r)

5:執行以下安裝指令碼

sudo chmod a+x NVIDIA-Linux-x86_64-375.39.run 變為可執行檔案

./NVIDIA-Linux-x86_64-375.39.run --kernel-source-path=/usr/src/kernels/3.10.0-514.el7.x86_64 -k $(uname -r) --dkms -s

遇到問題:

You appear to be running an X server; please exit X before installing. For further details, please see the section INSTALLING THE NVIDIA DRIVER in the README available on the Linux driver download page at www.nvidia.com.

sudo init 3 注意空格 會做掉x 

rm /tmp/.X* 

上面的命令是刪掉X 的鎖檔案 

再次cd 到.run檔案所在目錄 

再次執行 sudo ./.run檔案 

遇到的問題:

 ERROR: Unable to load the kernel module 'nvidia.ko'.

原因是核心預設開啟了nouveau模組,如果沒有執行第三步會報該錯誤

Unable to load the 'nvidia-drm' module

沒有安裝dkms模組導致

Your kernel headers for kernel 3.10.0-229.el7.x86_64 cannot be found

原因是找不到與核心匹配的kernel-header庫檔案,執行

yum install -y "kernel-devel-uname-r == $(uname -r)" 即可

其他注意事項:

--dkms 可以將Nvidia模組編譯進核心預設載入模組,以後升級核心時不需要重新重新安裝驅動

-s 選項是silence模式安裝,去掉-s是互動式模式安裝

二、安裝 cuda

安裝CUDA10.0(下面的方法摘抄自網上,實際安裝的是cuda-10.0)

1、在這裡下載 CUDA最新版本, 這裡下載的是runfile local版本,因為可以選擇不安裝驅動(前面已經安裝過);

給runfile( cuda_8.0.61_375.26_linux.run )新增執行許可權並執行安裝:

cd ~/Download/

sudo chmod +x cuda_8.0.61_375.26_linux.run

sudo sh cuda_8.0.61_375.26_linux.run

總是出現:

Extraction failed.

Ensure there is enough space in /tmp

Signal caught, cleaning up

解決方法:

sudo mkdir /home/tmp

sudo chmod 1777 /home/tmp

sudo sh cuda_8.0.44_linux.run --tmpdir=/home/tmp/

根據命令列提示進行安裝:

  • 按`q`退出條款瀏覽或者按`空格`直到條款末尾,輸入 accept 接受條款;

  • 輸入n不安裝nvidia影象驅動,前面已經安裝好驅動;

  • 輸入y安裝cuda 8.0 toolkit;

  • 回車確認cuda預設安裝路徑(/usr/local/cuda-8.0);

  • 輸入y安裝CUDA 8.0 Samples;

  • 輸入CUDA 8.0 Samples安裝路徑:/home/使用者名稱/CUDA/samples(選擇你喜歡的目錄進行安裝)。

2、設定環境變數

export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}

export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

export CUDA_HOME=/usr/local/cuda

選擇第三種方法

三、安裝cuDNN(下面的方法摘抄自網上,實際安裝的是cuda-10.0配套版本)

cuDNN6.0和CUDA8.0最佳拍檔,所以在NVIDIA官網上下載,找到cudnn的下載頁面: https://developer.nvidia.com/rdp/cudnn-download ,選擇"Download cuDNN v6.0 (April 27, 2017), for CUDA 8.0" 中的 "cuDNN v6.0 Library for Linux":(這裡選擇的是和cuda-10.0 配套的cudnn)

下載後安裝非常簡單,就是解壓然後拷貝到相應的系統CUDA路徑下

把cudnn-8.0-linux-x64-v6.0.tgz 拷貝到/usr/local/cuda一下命令

sudo cp cudnn-8.0-linux-x64-v6.0.tgz /usr/local/cuda

注意最後一行拷貝時 "-d"不能少, 否則會提示.so不是symbol link:

tar -zxvf cudnn-8.0-linux-x64-v6.0.tgz

sudo cp cuda/include/cudnn.h /usr/local/cuda/include/

sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ -d