1. 程式人生 > >自制centos7安裝NVIDIA驅動及CUDA

自制centos7安裝NVIDIA驅動及CUDA

需準備檔案包括NVIDIA驅動(官網https://www.geforce.cn/drivers)以及cuda Toolkit(官網https://developer.nvidia.com/cuda-downloads)
首先檢視自己GPU型號
lspci | grep -i vga
 
按照對應版本下載,驅動Linux64位--Geforce GTX970--Chinese(simplified),選擇最新版本下載(BETA為測試版,不要下載)
 
然後下載cuda,下載runfile(local)本地可執行run檔案
 
注:遇到坑:兩檔案可存放於/tmp資料夾下,之前存放於/dev資料夾下重啟之後便不存在了。
1安裝顯示卡(NVIDIA)驅動
1.檢查GPU是否安裝及型號
    lspci | grep nvidia
2.安裝gcc、gcc-c++
    yum install gcc
    yum install gcc++
3.安裝kernel-devel和kernel-headers
    yum install kernel-devel
    yum install kernel-headers
4.賦予許可權
chmod 755 NVIDIA ... .run
chmod 755 cuda ... .run
5.進入命令列介面並安裝驅動
root許可權下進入(su root切換為root)使用者->init 3進入命令列介面->根據提示分別點選NVIDIA ... .run和cuda ... .run安裝驅動和cuda
注:可能會遇到坑
ERROR: The Nouveau kernel driver is currently in use by your system. This  driver is incompatible with the NVIDIA driver, and must be disabled before proceeding.
Please consult the NVIDIA driver README and your Linux distribution's documentation
 for details on how to correctly  disable the Nouveau kernel driver.
解決辦法:
1)關閉Nouveau
cd /etc/modprobe.d->找blacklist.conf,若沒有則新建( touch blacklist.conf)->vim blacklist.conf->在其中加入blacklist nouveau(a鍵新增,Esc-> wq儲存退出)
注:關閉nouveau之後可以在/usr/local/
2)使用dracut重新建立 initramfs image file
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname-r).img.bak
 dracut -v /boot/initramfs-$(uname -r).img $(uname -r)
3)重啟系統
4)檢查自己核心版本號
uname -r
5)啟動安裝NVIDIA ... .run和cuda ... .run
./ NVIDIA... .run
注:若出現unable to find the kernel source tree for the currently running kernel.的錯誤,則輸入指令 ./ ... .run --kernel-source-path=/usr/src/kernels/核心版本號
注:install NVIDIA's 32-bit compatibility libearies?->No
would you like to run the nvidia-xconfig utility to automatically update your X configuration file?->No
2安裝cuda
./ cuda... .run(同樣加入--kernel-source-path=/usr/src/kernels/核心版本號)
按d或者s或者向下箭頭翻頁閱讀使用者協議,最後輸入accept
接下來安裝會有很多問題需要選擇:
第一個問題Do you want to install NVIDIA Accelerated Graphics Driver?->yes
第二個問題Do you want to install the OpenGL libraries?->no安裝
可能是因為桌面系統是採用3D渲染的,也可能是驅動衝突問題,總之安裝OpenGL之後圖形化使用者介面無法啟動
第三個問題Do you want to run nvidia-xconfig?->no即預設
其餘問題全部為yes,部分需要設定安裝位置的為預設,直接enter即可。
 


然後配置環境變數
vim ~/.bashrc
在末尾新增如下內容
export CUDA_HOME=/usr/local/cuda-10.0
export PATH=$CUDA_HOME/bin:$PATH
export LD_LIBRARY_PATH=$CUDA_HOME/lib64:$CUDA_HOME/lib:$PATH
 
source ~/.bashrc立即生效
reboot重啟,並驗證nvidia-smi