記一次伺服器上配置GPU版本tensorflow的經歷
阿新 • • 發佈:2018-12-27
早就耳聞tensorflow-gpu與CUDA,cudnn三者之間版本匹配很複雜,今天算是見識到了。
首先看了下伺服器上的CUDA、cudnn版本,分別是CUDA8.0,cudnn7.0.4
這個匹配很奇怪,一般都是CUDA8 + cudnn6或者 CUDA9 + cudnn7
後來知道是要看軟連結的(軟連結的含義請自行百度),安裝了cudnn7未必使用的就是7版本
伺服器上軟連結情況是這樣的
果然,軟連結的是cudnn5。所以我的配置實際上是CUDA8 + cudnn5
接著查閱到tensorflow官網上有介紹,如下圖
那很自然就想到安裝1.2.0版本的tensorflow了,結果是這樣,執行import tensorflow as tf
Tensorflow都匯入不了
繼續google…
期間嘗試了更換GCC版本(失敗,甚至產生了其他錯誤)
在我賬號下的.bashrc中新增路徑 export LD_LIBRARY_PATH=/usr/local/cuda/lib64/
(失敗,可以匯入tensorflow,但不能使gpu)
更改cudnn的軟連結(沒敢試,因為會修改整個伺服器)
最後一氣之下,我不用gpu了行吧,因為要使用dataset,所以重新下載了tensorflow1.4.0,雖然想著不用gpu,但因為某種執念,還是下載了gpu版本的,然後,跑了下程式,發現
能用gpu了
好了!
好了?
好了。。
之前
現在
所以最終是CUDA8 + cudnn5 + tensorflow-gpu1.4.0
注:只是記錄了本人的經歷與理解,如有錯誤之處,歡迎批評指正!