1. 程式人生 > >記一次伺服器上配置GPU版本tensorflow的經歷

記一次伺服器上配置GPU版本tensorflow的經歷

早就耳聞tensorflow-gpu與CUDA,cudnn三者之間版本匹配很複雜,今天算是見識到了。

首先看了下伺服器上的CUDA、cudnn版本,分別是CUDA8.0,cudnn7.0.4
在這裡插入圖片描述
這個匹配很奇怪,一般都是CUDA8 + cudnn6或者 CUDA9 + cudnn7
後來知道是要看軟連結的(軟連結的含義請自行百度),安裝了cudnn7未必使用的就是7版本
伺服器上軟連結情況是這樣的
在這裡插入圖片描述
果然,軟連結的是cudnn5。所以我的配置實際上是CUDA8 + cudnn5
接著查閱到tensorflow官網上有介紹,如下圖
在這裡插入圖片描述
那很自然就想到安裝1.2.0版本的tensorflow了,結果是這樣,執行import tensorflow as tf


在這裡插入圖片描述
Tensorflow都匯入不了

繼續google…
期間嘗試了更換GCC版本(失敗,甚至產生了其他錯誤)
在我賬號下的.bashrc中新增路徑 export LD_LIBRARY_PATH=/usr/local/cuda/lib64/(失敗,可以匯入tensorflow,但不能使gpu)
更改cudnn的軟連結(沒敢試,因為會修改整個伺服器)

最後一氣之下,我不用gpu了行吧,因為要使用dataset,所以重新下載了tensorflow1.4.0,雖然想著不用gpu,但因為某種執念,還是下載了gpu版本的,然後,跑了下程式,發現
能用gpu了
好了!
好了?
好了。。

之前
在這裡插入圖片描述
現在
在這裡插入圖片描述
所以最終是CUDA8 + cudnn5 + tensorflow-gpu1.4.0

注:只是記錄了本人的經歷與理解,如有錯誤之處,歡迎批評指正!