本文將圍繞幾個步驟來講。
因為本人是MSP,微軟送了150刀的額度給我隨便使用。這篇文章是要講將Azure用作雲計算平臺,對於我來說,我是做機器學習的,那麽Azure就要有機器學習的平臺。
本文的目的是,在Azure上搭建虛擬機,安裝TensorFlow,在本地通過XShell進行遠程連接。
===================================
1,在Azure上搭虛擬機
首先我們打開Azure。
之後點擊右上角的Terminal,選擇Bash,進行最初的準備。此時將會分配一個新的存儲空間給你使用。
輸入:
sudo pip install azure-cli
之後:
az login
接下來我們新建一個資源組用作管理,資源組選擇EastUS。
az group create -n tensorflow -l EastUS
這個時候我們可能需要一個SSH密鑰對,這個我們待會再說。
接下來我們新建一個虛擬機,選擇左邊的側欄:
選擇ubuntu 16.04 LTS即可,之後按照自己需要的進行定制。
在第一步的時候可能需要你選擇用戶名或者SSH,此時建議先使用用戶名,之後再禁用。
一切都配置完成之後,啟動虛擬機:
az vm start -g tensorflow -n tensorflow
使用用戶名密碼登陸。
接下來我們安裝CUDA8 + CuDNN 5.1. TensorFlow官方尚未支持CUDA9,所以我們暫時使用CUDA8.
wget https://developer.nvidia.com/compute/cuda/8.0/prod/local_installers/cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64-deb sudo dpkg -i cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64-deb sudo apt-get update sudo apt-get install -y cuda rm cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64-deb
之後我們可以使用
nvidia-smi
查看GPU狀態。
下一步安裝CuDNN 5.1.
wget http://developer.download.nvidia.com/compute/redist/cudnn/v5.1/cudnn-8.0-linux-x64-v5.1.tgz sudo tar -xzf cudnn-8.0-linux-x64-v5.1.tgz -C /usr/local rm cudnn-8.0-linux-x64-v5.1.tgz sudo ldconfig
最後添加進環境變量:
export CUDA_HOME=/usr/local/cuda-8.0 export PATH=${CUDA_HOME}/bin:${PATH} export LD_LIBRARY_PATH=${CUDA_HOME}/lib64:/usr/local/cuda/lib64:${LD_LIBRARY_PATH}
因為我喜歡用python3,所以我要另外裝上Python3和對應的pip。
sudo apt-get install python3-setuptools sudo easy_install3 pip
這樣,你輸入Python3,pip3會啟動Python3,而輸入python,pip會啟動Python2.
之後安裝TensorFlow r1.2(因為1.3版本需要CuDNN 6+)
sudo apt-get install -y python3-dev sudo pip install tensorflow-gpu==1.2
TensorFlow的安裝完成。輸入下列語句進行測試:
>>> import tensorflow as tf
>>> session = tf.Session()
當然,你可以隨時離開虛擬機:
az vm deallocate -g tensorflow -n tensorflow
參考資料:
https://www.lutzroeder.com/blog/2016-12-27-tensorflow-azure/http://blog.csdn.net/silent56_th/article/details/77587792
http://blog.csdn.net/silent56_th/article/details/77587792
https://gist.github.com/diegopacheco/576ff74c2013ee79ea8060945b1e9a53
Tags: 我們 Azure 之後 選擇 使用 cuda-repo-ubuntu
文章來源: