【CUDA C學習】Day01：CUDA安裝

阿新 • • 發佈：2019-02-09

基本情況

安裝包：
CUDA_10.0_.run
測試系統：
Ubuntu16.04
已測試顯示卡：
Nvidia GeForce GTX 1080TI
Nvidia GeForce GTX 970
Nvidia GeForce GTX 960
Nvidia GeForce GTX 960m

安裝

第1步：驗證電腦是否支援CUDA

驗證電腦是否有一個可以支援CUDA的GPU
在ubuntu的終端中輸入命令：

$ lspci | grep -i nvidia 

顯示出你的NVIDIA GPU版本資訊，筆者結果為
01:00.0 VGA compatible controller: NVIDIA Corporation GM204 [GeForce GTX 970] (rev a1)
01:00.1 Audio device: NVIDIA Corporation GM204 High Definition Audio Controller (rev a1)

CUDA的官網檢視自己的GPU版本是否在CUDA的支援列表中

https://developer.nvidia.com/cuda-gpus

驗證Linux版本是否支援 CUDA(Ubuntu 16.04)
輸入命令：

$ uname -m && cat /etc/*release

輸出結果為：
x86_64
DISTRIB_ID=Ubuntu
DISTRIB_RELEASE=16.04
...

第2步：下載安裝包

如果以上的檢查全部通過，恭喜你，可以進行以下操作。

在官網下載自己需要安裝的cuda版本 *.run 軟體

https://developer.nvidia.com/cuda-toolkit-archive

注意：
	為了避免無圖形安裝時的無法找到安裝包，建議將安裝包命名為cuda.r，並放置在個人目錄，筆者的為 /home/hirah

驗證安裝包完整性

http://developer.nvidia.com/cuda-downloads/checksums
$ md5sum <file>

如果輸出結果和官方網址提供一致即可。

第3步：準備安裝

1 ). 驗證安裝基礎環境

更新系統：

sudo apt-get update
sudo apt-get dist-upgrade

驗證系統是否安裝gcc
輸入命令：

 $  gcc --version      

輸出結果為：
gcc (Ubuntu 5.4.0-6ubuntu1~16.04.10) 5.4.0 20160609
Copyright (C) 2015 Free Software Foundation, Inc.
...

若未安裝輸入命令：

sudo apt-get install build-essential

2 ). 取消 nouveau（會和NVIDIA kernel module衝突）

a ). 輸入命令：

$  lsmod | grep nouveau

如果有輸出則代表nouveau正在載入，需要配置禁掉nouveau。
nouveau禁用方法：
a )、在/etc/modprobe.d中建立檔案blacklist-nouveau.conf
輸入命令：

$  sudo vim /etc/modprobe.d/blacklist-nouveau.conf

在檔案中輸入一下內容：

blacklist nouveau
options nouveau modeset=0

b )、執行：

$ sudo update-initramfs -u

c )、再執行：

$  lsmod | grep nouveau

注意：

若無內容輸出，則禁用成功；
若仍有內容輸出，請檢查a、b、c操作，並重覆上述操作。
e ) 、重啟：

$ sudo reboot

3 ). 獲取Kernel Source

驗證系統是否安裝kernel source 和 package development
a )、安裝kernel source

$ sudo apt-get install linux-source

b )、檢視正在執行的系統核心版本：
輸入命令：

$  uname -r

輸出結果為：

4.15.0-38-generic

c )、在終端中輸入：

$  sudo apt-get install linux-headers-$(uname -r)

結果顯示：
......
升級了 0 個軟體包，新安裝了 0 個軟體包，要解除安裝 0 個軟體包，有 0 個軟體包未被升級。

表示系統裡已經有了，不用重複安裝。

若以上各項驗證檢查均滿足要求，便可進行下面的正式安裝過程。

第4步：正式安裝

1 ). 處理之前安裝版本（會產生衝突，導致安裝失敗）

注意：

如果之前未安裝過任何版本nvidia驅動，請跳過；
如果你之前安裝過其他版本，請執行下面操作；

*** 型別一： .run檔案安裝執行 ***
解除安裝 Toolkit 執行檔案:
$ sudo /usr/local/cuda-X.Y/bin/uninstall_cuda_X.Y.pl
解除安裝NVIDIA驅動：
$ sudo /usr/bin/nvidia-uninstall

*** 型別二：RPM、Deb檔案安裝執行 ***
$ sudo apt-get --purge remove <package_name>

2). 重啟電腦，安裝新版本

$ sudo reboot

a ). 進入登入介面，不要登入進入桌面(否則可能會失敗)，直接按Ctrl+Alt+F1進入命令列介面，筆者顯示

Ubuntu16.04.5 LTS pc tty1
pc login：
輸入使用者名稱，回車；
passwd
輸入密碼，回車；

b ). 關閉圖形介面
輸入命令：

$ sudo service lightdm stop

c ). 安裝

切換到cuda安裝檔案的路徑：
輸入命令：

$ cd
$ sudo chmod +777 ./<cuda_fliename>
$ sudo ./<cuda_filename>

安裝按提示進行

* 1) Do you accept the previously read EULA?
	 accept/decline/quit: accept
* 2) Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 410.48?
	(y)es/(n)o/(q)uit: yes
	
* 3) Do you want to install OpenGL libraries?
	(y)es/(n)o/(q)uit: no
注意：如果電腦是雙顯，且主顯是非NVIDIA的GPU在工作需要選擇no，否則可以yes

* 4) Do you want to run nvidia-xconfig?
	(y)es/(n)o/(q)uit: n
注意：如果電腦是雙顯，且主顯是非NVIDIA的GPU在工作需要選擇no，否則可以yes

* 5) Install the CUDA 10.0 Toolkit?
	 (y)es/(n)o/(q)uit: y
* 6) Enter Toolkit Location
	 [default is /usr/local/cuda-10.0 ]:
* 7) Do you want to install a symbolic link at /usr/local/cuda?
	 (y)es/(n)o/(q)uit: y
* 8) Install the CUDA 10.0 Samples?
	 (y)es/(n)o/(q)uit: y
* 9) Enter CUDA Samples Location
	 [default is /home/hirah ]:

安裝成功後，會顯示

==========
= summary =
==========
Driver: Installed
Toolkit: Install in /usr/local/cuda-10.0
samples: Install in /home/hirah,(but missing recommended libraries)

表示安裝成功，否則會顯示failed。

重新啟動圖形化介面，輸入命令：

$ sudo service lightdm start

返回到圖形化登入介面。
如果能夠成功登入，則表示不會遇到迴圈登入的問題，基本說明CUDA的安裝成功了。

** 注意：**
如果你遇到了重複登陸情況，首先回憶是否在安裝openGL時可能不注意選擇了yes，請解除安裝cuda,然後重灌。
解除安裝方法：

在登陸介面狀態下，按Ctrl + Alt + f1,進入文字使用者介面
登入輸入命令：

$ sudo /usr/local/cuda-10.0/bin/uninstall_cuda_10.0.pl
$ sudo /usr/bin/nvidia-uninstall
$ reboot

重新安裝*.run，再次安裝時請一定留意，在提示是否安裝OpenGL時，如果是雙顯示卡應該選則no。

第5步：檢查安裝狀態

1) 檢查Device Node Verification。

輸入命令：

$ sudo reboot
$ ls /dev/nvidia*

可能出現a、b兩種結果，請對號入座。

若結果顯示

/dev/nvidia0      /dev/nvidiactl      /dev/nvidia-modeset

或顯示出類似的資訊，應該有三個（包含一個類似/dev/nvidia-modeset的檔案），則安裝成功。

若結果顯示

ls: cannot access/dev/nvidia*: No such file or directory
或
/dev/nvidia0     /dev/nvidiactl

沒有/dev/nvidia-modeset，即檔案顯示不全。
官方安裝指導的解決方案：

a ). 新增一個啟動指令碼
輸入命令

$ sudo nano /etc/rc.local

如果你是第一次開啟這個檔案，它應該是空的(除了一行又一行的#註釋項外)。這檔案的第一行是

#!/bin/sh -e

把-e去掉（這步很重要，否則它不會載入這文字的內容）
b ). 然後把下列內容複製到其中，儲存退出。

#!/bin/bash

/sbin/modprobe nvidia

if [ "$?" -eq 0 ]; then
  # Count the number of NVIDIA controllers found.
  NVDEVS=`lspci | grep -i NVIDIA`
  N3D=`echo "$NVDEVS" | grep "3D controller" | wc -l`
  NVGA=`echo "$NVDEVS" | grep "VGA compatible controller" | wc -l`

  N=`expr $N3D + $NVGA - 1`
  for i in `seq 0 $N`; do
    mknod -m 666 /dev/nvidia$i c 195 $i
  done

  mknod -m 666 /dev/nvidiactl c 195 255

else
  exit 1
fi

/sbin/modprobe nvidia-uvm

if [ "$?" -eq 0 ]; then
  # Find out the major device number used by the nvidia-uvm driver
  D=`grep nvidia-uvm /proc/devices | awk '{print $1}'`

  mknod -m 666 /dev/nvidia-uvm c $D 0
else
  exit 1
fi

c ). 重啟
輸入：

$ ls /dev/nvidia*

應該能直接看到/dev目錄下的三個nvidia的檔案：/dev/nvidia0 /dev/nvidiactl /dev/nvidia-modeset

2) 設定環境變數

a ). 終端中輸入

$ sudo gedit /etc/profile

b ). 在開啟的檔案末尾，新增以下兩行。
64位系統：

export PATH=/usr/local/cuda-10.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

儲存檔案，並重啟。
c ). 重啟電腦，檢查上述的環境變數是否設定成功。

驗證驅動版本
輸入命令：

$ cat /proc/driver/nvidia/version
結果顯示:
NVRM version: NVIDIA UNIX x86_64 Kernel Module  410.48  Thu Sep  6 06:36:33 CDT 2018
GCC version:  gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.10)

驗證CUDA Toolkit
敲入

$ nvcc -V       
結果顯示：
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2018 NVIDIA Corporation
Built on Sat_Aug_25_21:08:01_CDT_2018
Cuda compilation tools, release 10.0, V10.0.130

如果是這樣的：

The program 'nvcc' is currently not installed. You can install it by typing:
sudo apt-get install nvidia-cuda-toolkit

可能是環境配置沒有成功，請重複上述步驟2。

執行示例檔案

$ cd ~/NVIDIA_CUDA-10.0_Samples
$ make -j8
$ cd bin/x86_64/linux/release/
$ ./deviceQuery
顯示結果為：
...
deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 10.0, CUDA Runtime Version = 10.0, NumDevs = 1
Result = PASS
$ ./bandwidthTest 
顯示結果為：
...
Result = PASS

總結

【CUDA C學習】Day01：CUDA安裝

基本情況安裝包： CUDA_10.0_.run 測試系統： Ubuntu16.04 已測試顯示卡： Nvidia GeForce GTX 1080TI Nvidia GeForce GTX 970 Nvidia GeForce GTX 960 Nvidia

【無監督學習】1：K-means聚類演算法原理

前言：粗略研究完神經網路基礎——BP、CNN、RNN、LSTM網路後自己算是鬆懈了很多，好長的時間都沒有堅持再更新部落格了。“腐敗”生活了這麼久，還是要找到自己一點樂趣吧，於是想了一想，決定把《機器學習》的演算法研究過得都重新梳理一遍，於是就從無監督學習——聚類

【無監督學習】5：譜聚類演算法原理介紹

前言：學習譜聚類，最好有一些圖論、矩陣分解（SVD）方面的知識，這樣會更加有利於譜聚類的學習。當然，譜聚類理解起來並不困難，實際操作也大多是譜聚類+K-means聚類聯合使用的。 –—-—-—-—-—-—-—-—-—-—-—-—–—-—-—-—-—-—-—-—

【無監督學習】2：DBSCAN聚類演算法原理

前言：無監督學習想快一點複習完，就轉入有監督學習 –—-—-—-—-—-—-—-—-—-—-—-—–—-—-—-—-—-—-—-——-—-—-—-—-—-—-—-—-—-—-—-—-—-——- –—-—-—-—-—-—-—-—-—-—-—-—–—-—-—-—

【無監督學習】3：Density Peaks聚類演算法實現（區域性密度聚類演算法）

前言：密度峰聚類演算法和DBSCAN聚類演算法有相似的地方，兩者都是基於密度的聚類方式。自己是在學習無監督學習過程中，無意間見到介紹這種聚類演算法的文章，感覺密度峰聚類演算法方法很新奇，操作也很簡答，於是自己也動手寫一下了。 –—-—-—-—-—-—-—-—-

【網站架構學習】萬無一失：網站的高可用架構（上）

一、網站的高可用架構 2011年4月12曰，亞馬遜計算服務EC2 ( Elastic Computer Cloud )發生故障，其 ESB( Elastic Block Storage)服務不可用，故障持續了數天，最終還是有部分資料未能恢復。這一故

【微服務學習】Polly：熔斷降級組件

有效期 .aspx 離開 mini execute 次數並發執行學習 spec 何為熔斷降級　　“熔斷器如同電力過載保護器。它可以實現快速失敗，如果它在一段時間內偵測到許多類似的錯誤，會強迫其以後的多個調用快速失敗，不再訪問遠程服務器，從而防止應用程序不斷地嘗試執行

【深度學習】Ubuntu下CUDA+ cuDNN + TensorFlow/TensorLayer 深度學習環境搭建

文章目錄概述安裝Anaconda並建立環境安裝CUDA和cuDNN 下載安裝CUDA 下載安裝cuDNN 安裝TensorFlow和TensorLayer 檢查安裝結果

菜鳥入門【ASP.NET Core】5：命令行配置、Json文件配置、Bind讀取配置到C#實例、在Core Mvc中使用Options

加載中間 view tar public png 配置到 index 不同命令行配置我們通過vs2017創建一個控制臺項目CommandLineSample 可以看到現在項目以來的是dotnet core framework 我們需要吧a

【Objective-C學習筆記】變數和基本的資料型別

OC是增強了C的特性，所以在變數和基本資料型別上基本與C一致。在OC中變數命名有如下規則：由字母、數字、下劃線、$符號組成必須以字母、下劃線、$符號開頭大小寫敏感在OC中定義變數的時候不能使用OC的保留字，OC的保留字如下： OC中有如下基本資料型別： in

【網站架構學習】瞬時響應：網站的高效能架構《網站效能測試》

瞬時響應：網站的高效能架構什麼叫高效能的網站？兩個網站效能架構設計方案：A方案和B方案，A方案在小於100個併發使用者訪問時，每個請求的響應時間是1秒，當併發請求達到200的時候，請求的響應時間將

【網站架構學習】瞬時響應：應用伺服器效能優化

應用伺服器效能優化一、應用伺服器效能優化應用伺服器就是處理網站業務的伺服器，網站的業務程式碼都部署在這裡，是網站開發最複雜，變化最多的地方，優化手段主要有快取、叢集、非同步等。 1.1、分散式快取

【C學習】全通紙筆王網上閱卷系統 APMS_Setup.exe IP修改程式

前段時間用APMS遠端改卷，發現瀏覽器需要安裝閱卷外掛，安裝的過程提示IP無效，無法正常安裝外掛。後來用UEdit開啟可見.exe檔案中已經內建配置好的IP地址，可以通過修改為指定的IP後，便可以在本地正常安裝外掛並正常進入閱卷系統了。為了方便起見，用C和C#以及Delphi寫了一份程式碼

【Java爬蟲學習】WebMagic框架爬蟲學習實戰一：爬取網易雲歌單資訊，並存入mysql中

最近，需要使用Java進行爬蟲編寫，就去學了Java的爬蟲。因為之前學習了Scrapy框架，所以學Java的爬蟲使用了WebMagic框架，這個框架是基於Scrapy框架開發的。大家有興趣可以去看看操作文件：這個框架是國人開發的，所以說明文件都是中文，簡單易懂。

【C#學習】delegate(委託) 和 event(事件）

C# 中的委託（Delegate）類似於 C 或 C++ 中函式的指標。委託（Delegate）是存有對某個方法的引用的一種引用型別變數。引用可在執行時被改變。在C#中方法不能作為引數直接傳遞，必須使用委託（用來委託方法）。delegate(委託)是一種特殊的引用型別，它將方法也作為特殊的物件封裝

【深度學習】Ubuntu 常用軟體安裝：Tensorflow + TeamViewer + Caffe + ... + Matlab

【UpdateTime：20180212】（原文由於寫了幾個敏感詞彙，被強制刪除了，特此重新整理一篇） 2017.05.25：根據實踐過程，整理了第一版。 2017.12.22：由於第一版涉及幾個敏感詞彙，博文被強制移到回收站，重新整理一篇。 2018.01.05：

【深度學習】8：CNN卷積神經網路與sklearn資料集實現數字識別

前言：這個程式碼是自己閒暇無事時候寫的。因為CNN卷積神經網路用MNIST資料集、sklearn資料集程式碼很多部分都很相似，這一篇就不附詳細說明，原始碼最下。CNN卷積神經網路的工作原理，請詳情參考——【深度學習】5：CNN卷積神經網路原理、MNIST資料

CUDA學習筆記一：CUDA+OpenCV的影象轉置，採用Shared Memory進行CUDA程式優化

原創文章，轉載請註明出處...... 一、問題背景最近要做一個關於CUDA的學習分享報告，想在報告中舉一個利用CUDA進行影象處理的例子，並使用Shared Memory避免Global Memory不合並訪存情況，提高影象處理效能。但是對於CUDA程式如

【排序(C++實現)】：二分歸併排序

一、虛擬碼 1. MergeSort(A,l,r) 2. Merge(A,l,m,r) 二、C/C++程式碼 /*********************************************************

【深度學習】5：CNN卷積神經網路原理、識別MNIST資料集

前言：先坦白的說，深度神經網路的學習在一開始對我造成的困擾還是很大的，我也是通過不斷地看相關的視訊資料、文獻講解嘗試去理解記憶。畢竟這些內容大多都是不可查的，我們看到的都只是輸入輸出的東西，裡面的內部運作以及工作原理，都需要沉心靜思。這篇CNN卷積神經網路的

【CUDA C學習】Day01：CUDA安裝

基本情況

安裝

第1步：驗證電腦是否支援CUDA

第2步：下載安裝包

第3步：準備安裝

1 ). 驗證安裝基礎環境

2 ). 取消 nouveau（會和NVIDIA kernel module衝突）

3 ). 獲取Kernel Source

第4步：正式安裝

1 ). 處理之前安裝版本（會產生衝突，導致安裝失敗）

2). 重啟電腦，安裝新版本

第5步：檢查安裝狀態

1) 檢查Device Node Verification。

2) 設定環境變數

總結

相關推薦