阿里雲Tesla P100GPU雲伺服器搭建TensorFlow環境

阿新 • • 發佈：2018-11-11

最近基於深度學習的影象識別專案需要用到GPU加速,申請了阿里雲的GPU伺服器,在搭建過程中遇到了一些問題,現在將搭建過程記錄

環境: 阿里雲GPU伺服器Tesla P100

作業系統: Ubuntu 16.04

準備安裝包(這個是我用來測試搭建的包,如果想用新版本,請自行下載,對應的包檔案會提供下載連結):

Nvidia驅動: NVIDIA-Linux-x86_64-390.46.run

官網下載地址: http://www.nvidia.cn/Download/index.aspx?lang=cn (選好自己的GPU型號之後可以直接下載)

CSDN下載地址:https://download.csdn.net/download/u013092293/10403033

CUDA包:cuda_8.0.61_375.26_linux.run

官網下載地址: https://developer.nvidia.com/cuda-toolkit-archive (下載時需要註冊賬號)

檔案太大發不上來,請自行下載

CUDNN包:cudnn-8.0-linux-x64-v6.0.tgz

官網下載地址: https://developer.nvidia.com/rdp/cudnn-archive(下載時需要註冊賬號)

CSDN下載地址:https://download.csdn.net/download/u013092293/10403092

本地環境

windows

xshell

開始前注意事項

使用xshell遠端申請的GPU伺服器(具體使用方法百度),如果連線失敗

1.檢查登入名和密碼

2.檢查阿里雲GPU伺服器的安全組規則(需要開啟埠22,在選擇協議型別時設定SSH(22),自定義TCP都可以)

3.檢查公司的防火牆限制

開始安裝

1.更新源

sudo apt-get update

2.python環境為Ubuntu 16.04預設的python環境,預設有python 2.7.12,python 3.5.2,現在我們使用python 3.5.2

3.安裝pip3工具

sudo apt-get install python3-pip

4.安裝lrzsz,使window可以向linux伺服器上傳檔案

sudo apt-get install lrzsz

5.上傳三個包檔案

在伺服器終端:

彈出框中選擇

NVIDIA-Linux-x86_64-390.46.run,cuda_8.0.61_375.26_linux.run,cudnn-8.0-linux-x64-v6.0.tgz

6.安裝nvidia驅動

cd到上傳檔案目錄

執行驅動安裝

sudo sh ./NVIDIA-Linux-x86_64-390.46.run

掛載Nvidia驅動

modprobe nvidia

檢視nvidia是否安裝成功

nvidia-smi

7.安裝cuda

cd到上傳目錄

sudo sh ./cuda_8.0.61_375.26_linux.run

開始執行後會輸出很多資訊,使用空格翻頁,到底後出現幾個提問,按順序填寫

Do you accept the previously read EULA? accept

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 xxx.xx? n

Install the CUDA 8.0 Toolkit? y

Enter Toolkit Location

[ default is /usr/local/cuda-8.0 ]: 回車

Do you want to install a symbolic link at /usr/local/cuda? y --(生成cuda快捷方式)

Install the CUDA 8.0 Samples? y --(安裝CUDA8.0的例子,可以選擇不安裝)

Enter CUDA Samples Location

[ default is /root ]: 回車

8. 設定CUDA環境變數

sudo vim ~/.bashrc

按G到最後一行,按i開始進行插入

export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda-8.0/lib64:/usr/local/cuda-8.0/extras/CUPTI/lib64"

export CUDA_HOME=/usr/local/cuda-8.0

esc --> :wq

儲存退出

配置立即生效

source ~/.bashrc

9. 安裝CUDNN(其實為解壓拷貝)

cd到檔案上傳目錄

解壓cudnn

tar -zxvf cudnn-8.0-linux-x64-v6.0.tgz

開始拷貝(如果都按上述步驟來的話,下面的命令可直接執行)

sudo cp cuda/include/cudnn.h /usr/local/cuda-8.0/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-8.0/lib64

sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda-8.0/lib64/libcudnn*

10.安裝TensorFlow GPU版本

當前選擇為tensorflow 1.3版本,

方法一:網好的話使用

pip3 install tensorflow-gpu==1.3

方法二:網不好的話,提供清華映象站地址:https://mirrors.tuna.tsinghua.edu.cn/tensorflow/linux/gpu/

下載下whl檔案後安裝:

pip3 install tensorflow_gpu-1.3.0rc2-cp35-cp35m-linux_x86_64.whl

安裝過程中可能會因為網路原因出現中斷,多安裝幾次

11.安裝完成之後

$ python3

> import tensorflow

不報錯,即為安裝成功

阿里雲Tesla P100GPU雲伺服器搭建TensorFlow環境

最近基於深度學習的影象識別專案需要用到GPU加速,申請了阿里雲的GPU伺服器,在搭建過程中遇到了一些問題,現在將搭建過程記錄環境: 阿里雲GPU伺服器Tesla P100 作業系統: Ubuntu 16.04 準備安裝包(這個是我用來測試搭建的包,如果想用新版本,請自行下載,對應的包檔案會提

阿里雲伺服器搭建java環境詳細步驟3

上面兩步主要是準備工作,現在開始進行在伺服器上的軟體安裝 1.安裝JDK 在自己放置的軟體的位置執行以下命令 //新增所執行的操作的許可權 chmod +x jdk-8u191-linux-x64.rpm //安裝軟體包 rpm -ivh jdk-8u191-l

阿里雲輕量應用伺服器搭建配置詳解

好久沒有更新部落格了，說來也是慚愧沒有養成記錄經驗的習慣。有很多技術開發同學都想擁有自己的伺服器用來搭建個人網站，或者展示作品，但是怕租上不會配置或者嫌配置繁瑣難下決定。廢話不多說直接進入正題，前兩天幫朋友配置一臺阿里雲的輕量應用伺服器（注意不是雲伺服器ECS但是大同小異）。伺服器規格

阿里雲伺服器搭建java環境詳細步驟4

前面其實已經完成了伺服器java環境方面的搭建,這裡算是附送的步驟吧如何將工程打包,並部署到伺服器上 1.將工程打包成war包本人這裡使用的idea,所以參考idea的方式來打包. 首先來到idea的程式結構部分,可以點選File,然後點選Project Structure 然後點選

阿里雲伺服器搭建java環境詳細步驟2

上一個文章已經寫了購買方面的準備的工作,下面開始說準備的軟體部分. 二.準備需要的軟體 1.SecureCRT來連線阿里雲伺服器使用阿里雲伺服器的時候,發現它的網頁管理終端,經常很快進入息屏狀態,恢復又輸入遠端連線密碼,感覺十分麻煩,於是到網上搜索遠端連線的軟體,主要有兩個,一個是X

阿里雲伺服器搭建java環境詳細步驟1

在做專案的時候,可能會經常遇到需要使用雲伺服器的時候,這裡介紹的阿里雲的伺服器的java環境搭建,主要的搭建的軟體有jdk,mysql和tomcat,這些都是web專案必須的軟體吧. 這裡分為四步: 阿里雲伺服器搭建java環境詳細步驟1 阿里雲伺服器搭建java環境詳細步驟2 阿里雲伺

Ubuntu雲伺服器搭建J2EE環境

J2EE搭建雲伺服器 JDK 安裝 1. 檢視當前雲伺服器系統版本資訊 ```bash uname -a ``` 2. 下載並安裝JDK [Oracle官網JDK下載連結](http://www.oracle.com/technetwork/ja

為騰訊雲伺服器搭建lnmp環境

接上篇的介紹，雲主機已經好了，現在就是要搭建開發環境了，我使用的是lnmp環境（linux+nginx+mysql+php），在之前virtualbox虛擬機器上我也裝過這個環境。但是當時沒有人指點，

伺服器GPU Tensorflow環境搭建

export PATH=/usr/local/cuda/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda/lib64/:$LD_LIBRARY_PATH export CUDA_ROOT=/usr/local/cuda export LD_LIB

TensorFlow（1）：使用docker鏡像搭建TensorFlow環境

根據 free nts 安裝配置 wiki 永久 ebo 關於 exec 1，關於TensorFlow TensorFlow 隨著AlphaGo的勝利也火了起來。 google又一次成為大家膜拜的大神了。google大神在引導這機器學習的方向。同時docker 也是一個

[step by step]利用docker搭建Tensorflow環境（tensorboard + tensorflow+gpu）

前言本篇文章搭建環境的作業系統是ubuntu14，windows搭建docker的方式與ubuntu有所區別，win的使用者可以點選原文中的參考連線進行docker的搭建。掛載tensorboard的方法是一樣的，可供大家參考搭建docker 官方文件 https://do

伺服器搭建lamp環境

使用的例子：伺服器版本核心centos 7.04 Xshell連線到您的伺服器上，使系統處於最新狀態執行以下命令， yum update -y

伺服器搭建swoft環境

lump安裝 wget http://soft.vpser.net/lnmp/lnmp1.5.tar.gz -cO lnmp1.5.tar.gz && tar zxf lnmp1.5.tar.gz && cd lnmp1.5 && ./

基於Anaconda在windows下搭建TensorFlow環境（cpu版本安裝）

安裝TensorFlow CPU版本過程目錄：一.定義：TensorFlow是谷歌基於DistBelief進行研發的第二代人工智慧學習系統一.定義： TensorFlow是谷歌基於DistBelie

window 10 上搭建tensorflow環境

參考多方資料，自己搭建TensorFlow的環境，分享下經驗！一安裝Anaconda 什麼是Anaconda？簡單地說，Anaconda就是一個整合的Python環境，其中第三方庫是一大亮點安裝步驟 1.前往Anaconda官網下載映象，再安裝，建議下載清華大學映象，訪問國外伺服

代理伺服器搭建socks5環境的方法

轉：http://www.ccproxy.com/socks5-dai-li.htm SOCKS5搭建準備工作 1) 一臺VSP伺服器(或者朋友的電腦)，假如公網IP地址為：202.6.6.6 2) 一臺客戶端 3) 一套CCProxy軟體(下載地址：http:

利用Anaconda搭建TensorFlow環境並在Jupyter Notebook使用

開啟Anaconda Prompt 建立一個tensorflow 虛擬環境： conda create -n tensorflow python=3.6 啟用tensorflow虛擬環境 activate tensorflow 查詢當前

centos7伺服器搭建nginx環境,ffmpeg實現本地模擬推流

zlib、PCRE、OpenSSL Nginx、rtmp、openssl nginx下載地址 http://nginx.org/en/download.html 下載版本 http://nginx.org/download/nginx-1.12.2.tar.gz 下載命令

Nginx+Docker搭建tensorflow環境

環境系統:CentOS7 pip(python 2.7) 準備工作採用docker-compose構建映象,其中docker-compose使用pip安裝pip install docker

Windows下搭建TensorFlow環境3（CPU版本）

1. 開啟Cmake軟體； 2. 點選右側“Browse Source”按鈕，彈出對話方塊，選擇TensorFlow原始碼路徑（tensorflow/contrib/cmake）； 3. 再點選右側“Browse Build”按鈕，彈出對話方塊，選擇TensorFlow編譯後的存放路徑（tensorflow

阿里雲Tesla P100GPU雲伺服器搭建TensorFlow環境

相關推薦