linux/Centos 安裝GTX-1080Ti 顯示卡 配置顯示卡驅動 cuda cudnn
os: centos 6.9
顯示卡 :1080 TI
cuda :cuda-10.0
cudnn:cuDNN v 7.3.1
CentOS 6.9安裝NVIDIA GTX1080顯示卡驅動,直接說安裝步驟和遇到的問題:
一、安裝驅動
1:首先當然是要把驅動下載下來啦。我的電腦是NVIDIA的,所以自然先要訪問其官網:http://www.geforce.cn/drivers 根據你自己的顯示卡型號,選擇相應的顯示卡,進行下載勒,下載下來的是一個.run 的檔案。
2:OK,接下來就是安裝編譯環境:gcc、kernel-devel、kernel-headers (當然,如果你的電腦已經安裝了,自然就不用在裝了)
1 # yum -y install gcc kernel-devel "kernel-devel-uname-r == $(uname -r)" dkms
"kernel-devel-uname-r == $(uname -r)"可以確保安裝與當前執行核心版本一樣的kernel-header
3:修改/etc/modprobe.d/blacklist.conf 檔案,以阻止 nouveau 模組的載入
方法: 新增blacklist nouveau,註釋掉blacklist nvidiafb(如果存在)
blacklist.conf不存在時,執行下面的指令碼
# echo -e "blacklist nouveau\noptions nouveau modeset=0" > /etc/modprobe.d/blacklist.conf
4:重新建立initramfs image檔案
# mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
# dracut /boot/initramfs-$(uname -r).img $(uname -r)
5:執行以下安裝指令碼
sudo chmod a+x NVIDIA-Linux-x86_64-375.39.run 變為可執行檔案
./NVIDIA-Linux-x86_64-375.39.run --kernel-source-path=/usr/src/kernels/3.10.0-514.el7.x86_64 -k $(uname -r) --dkms -s
遇到問題:
You appear to be running an X server; please exit X before installing. For further details, please see the section INSTALLING THE NVIDIA DRIVER in the README available on the Linux driver download page at www.nvidia.com.
sudo init 3 注意空格 會做掉x
rm /tmp/.X*
上面的命令是刪掉X 的鎖檔案
再次cd 到.run檔案所在目錄
再次執行 sudo ./.run檔案
遇到的問題:
ERROR: Unable to load the kernel module 'nvidia.ko'.
原因是核心預設開啟了nouveau模組,如果沒有執行第三步會報該錯誤
Unable to load the 'nvidia-drm' module
沒有安裝dkms模組導致
Your kernel headers for kernel 3.10.0-229.el7.x86_64 cannot be found
原因是找不到與核心匹配的kernel-header庫檔案,執行
yum install -y "kernel-devel-uname-r == $(uname -r)" 即可
其他注意事項:
--dkms 可以將Nvidia模組編譯進核心預設載入模組,以後升級核心時不需要重新重新安裝驅動
-s 選項是silence模式安裝,去掉-s是互動式模式安裝
二、安裝 cuda
安裝CUDA10.0(下面的方法摘抄自網上,實際安裝的是cuda-10.0)
1、在這裡下載 CUDA最新版本, 這裡下載的是runfile local版本,因為可以選擇不安裝驅動(前面已經安裝過);
給runfile( cuda_8.0.61_375.26_linux.run )新增執行許可權並執行安裝:
cd ~/Download/
sudo chmod +x cuda_8.0.61_375.26_linux.run
sudo sh cuda_8.0.61_375.26_linux.run
總是出現:
Extraction failed.
Ensure there is enough space in /tmp
Signal caught, cleaning up
解決方法:
sudo mkdir /home/tmp
sudo chmod 1777 /home/tmp
sudo sh cuda_8.0.44_linux.run --tmpdir=/home/tmp/
根據命令列提示進行安裝:
-
按`q`退出條款瀏覽或者按`空格`直到條款末尾,輸入 accept 接受條款;
-
輸入n不安裝nvidia影象驅動,前面已經安裝好驅動;
-
輸入y安裝cuda 8.0 toolkit;
-
回車確認cuda預設安裝路徑(/usr/local/cuda-8.0);
-
輸入y安裝CUDA 8.0 Samples;
-
輸入CUDA 8.0 Samples安裝路徑:/home/使用者名稱/CUDA/samples(選擇你喜歡的目錄進行安裝)。
2、設定環境變數
export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda
選擇第三種方法
三、安裝cuDNN(下面的方法摘抄自網上,實際安裝的是cuda-10.0配套版本)
cuDNN6.0和CUDA8.0最佳拍檔,所以在NVIDIA官網上下載,找到cudnn的下載頁面: https://developer.nvidia.com/rdp/cudnn-download ,選擇"Download cuDNN v6.0 (April 27, 2017), for CUDA 8.0" 中的 "cuDNN v6.0 Library for Linux":(這裡選擇的是和cuda-10.0 配套的cudnn)
下載後安裝非常簡單,就是解壓然後拷貝到相應的系統CUDA路徑下
把cudnn-8.0-linux-x64-v6.0.tgz 拷貝到/usr/local/cuda一下命令
sudo cp cudnn-8.0-linux-x64-v6.0.tgz /usr/local/cuda
注意最後一行拷貝時 "-d"不能少, 否則會提示.so不是symbol link:
tar -zxvf cudnn-8.0-linux-x64-v6.0.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ -d