1. 程式人生 > >深度學習環境配置tensorflow+cuda9.1+cudnn-v7.1

深度學習環境配置tensorflow+cuda9.1+cudnn-v7.1

首先是這次配置的所有軟體:
ubuntu16.04
anaconda3
tensorflow_gpu
cuda9.1+cudnn-v7.1

一、安裝 Anaconda

建立一個 conda 計算環境

為了管理多個環境, 那麼我們至少要有兩個環境, 以便能夠進行移除或者切換.
命令列進入到Anaconda3-5.0.1-Linux-x86_64.sh檔案所在的路徑下後執行:

sudo bash Anaconda3-5.0.0-Linux-x86_64.sh

一路繼續,注意中間有一處可以修改安裝路徑的地方。

Anaconda3 will now be installed into this location:
/home/zerozone/anaconda3
- Press ENTER to confirm the location - Press CTRL-C to abort the installation - Or specify a different location below - [/home/zerozone/anaconda3] >>> /你的路徑

這一步不會出太大的問題。

啟用環境,使用 conda 安裝 TensorFlow-gpu 這裡有一個坑!!!!!

 conda create -n tensorflow python=3.5

1、如果你已經安裝或準備安裝cuda9.1 ,需要看此步,否則跳到第2步
!!目前官方的tensorflow發行還不支援cuda9.1
不過有大神編譯好了,這裡有非官方的支援cuda9.1和cudnn7.1的預編譯版TensorFlow。

https://github.com/mind/wheels/releases/
下載好後進入目錄繼續:

sudo aptitude install python3-pip
pip3 install 上面下載的 .whl 檔案
pip install --ignore-installed --upgrade \
> https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-1.6.0-cp35-cp35m-linux_x86_64.whl

CUDA+cuDNN安裝

一般會將工具安裝到諸如 /usr/local/cuda 之類的路徑.

解壓並拷貝 CUDNN 檔案到 安裝路徑下. 假設 Cuda 安裝 在 /usr/local/cuda, 在下載位置執行以下命令:

tar xvzf cudnn檔案
sudo cp cudnn-。。。/cudnn.h /usr/local/cuda/include
sudo cp cudnn-。。。/libcudnn* /usr/local/cuda/lib64

此外還需要設定 LD_LIBRARY_PATH 和 CUDA_HOME 環境變數. 可以考慮將下面的命令 新增到 ~/.bash_profile 檔案中, 這樣每次登陸後自動生效. 注意, 下面的命令 假定 CUDA 安裝目錄為 /usr/local/cuda:

export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64"
export CUDA_HOME=/usr/local/cuda

至此就可以測試tensorflow gpu環境了。
經過一天多的安裝,結合參考才過了一些坑。寫下來記錄和參考。

主要參考:

更新!!!測試後發現會在執行跑網路時 kernel died 的情況。又重新換成了 cuda9.0+cudnn-v7.0

在解除安裝 cuda9.1時由於是deb安裝 找不到.pl檔案
找到方法

sudo apt-get remove cuda-*

cuda9.0 官網可下,這次下deb安裝很不順利,下載慢

sudo dpkg -i cuda-repo-ubuntu1704-9-0-local-rc_9.0.103-1_amd64.deb
sudo apt-key add /var/cuda-repo-9-0-local-rc/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda

安裝失敗後 下載runflie檔案安裝


sudo bash cuda_9.0.176_384.81_linux-run

安裝過程需要輸入一些確認選項,過程如下:

Description

The NVIDIA CUDA Toolkit provides command-line and graphical
tools for building, debugging and optimizing the performance
Do you accept the previously read EULA?
accept/decline/quit: accept

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81?
(y)es/(n)o/(q)uit: n

Install the CUDA 9.0 Toolkit?
(y)es/(n)o/(q)uit: y

Enter Toolkit Location
 [ default is /usr/local/cuda-9.0 ]: 

Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: y

Install the CUDA 9.0 Samples?
(y)es/(n)o/(q)uit: y

Enter CUDA Samples Location
 [ default is /home/cqc ]: 

Installing the CUDA Toolkit in /usr/local/cuda-9.0 ..

cudnn-v7.0 還是因為註冊不了 不能下載。 找了好久

ok 一切照常。。。