nvidia-docker快速遷移caffe環境（GPU+VNCserver+lxde桌面）

阿新 • • 發佈：2019-01-09

有時候我們自己在本機上費力搭建了很複雜的環境（cuda(5,6,7,8)+cudnn+opencv(2,3)+matlab等等其他依賴），我們想遷移這個環境到另一臺機器上就需要重新安裝一遍，如果另一臺機器不是那麼“乾淨”裝了一些可能和你不一致的東西比如opencv，所以需要更換版本這時候需要徹底解除安裝乾淨，否則又會出現亂七八糟的問題，總之一句話遷移成本很高，風險很大。

回到正題，首先簡單介紹下虛擬機器和docker的區別

vm與docker框架，直觀上來講vm多了一層guest OS，同時Hypervisor會對硬體資源進行虛擬化，docker直接使用硬體資源，所以資源利用率相對docker低也是比較容易理解的

讓我們假設你有一個容器映象（image）容量是1GB，如果你想用一個完整的虛擬機器來裝載，你得需要容量的大小是1GB乘上你需要虛擬機器的數量。但使用Linux容器虛擬化技術（LXC）和AuFS，你可以共享1GB容量，如果你需要1000個容器，假設他們都執行在同樣的系統影像上，你仍然可以用稍微比1GB多一點的空間來給容器系統，一個完整的虛擬化系統得到了分給它的自有全部資源，只有最小的共享。你獲得了更多的隔離，但是這是很龐大的（需要更多的資源）使用Linux容器虛擬化技術（LXC），隔離性方面有所缺失，但是他們更加輕量，而且需要更少資源。所以你可以輕鬆執行1000個容器在一個宿主機器上，甚至眼都不眨。

docker和nvidia-docker的區別

由於我們深度學習需要用到GPU，使用docker時，需要對映裝置等等，docker容器對宿主機的依賴就會很多也就失去了便捷，並不能讓我們很舒服的遷移環境，nvidia-docker則很好的封裝了這些，只需要容器內的cuda版本和宿主機相同就行（這個要求很低了，而且這個要求現在也基本可以通過docker hub上別人做好的帶有各種cuda版本的映象來滿足，所以幾乎無要求）
其實nvidia-docker只是run 和 exec命令和docker執行不同，其餘的和docker執行的一模一樣

nvidia-docker安裝(ubuntu為例)

# **首先安裝docker** 

 1. sudo apt-get install -y --no-install-recommends \
    apt-transport-https \
    ca-certificates \
    curl \
    software-properties-common
 2. curl -fsSL https://apt.dockerproject.org/gpg | sudo apt-key add -
    #如果此處出現認證錯誤，curl後面-k忽略認證
 3.  sudo add-apt-repository \
       "deb https://apt.dockerproject.org/repo/ \
       ubuntu-$(lsb_release -cs) \
       main"
 4. sudo apt-get update
 5. sudo apt-get -y install docker-engine
 6. sudo docker run hello-world
    #它會自動下載這個hello-world映象，然後執行，成功出現hello world就是docker就是裝好了
 # **然後安裝nvidia-docker**
 7. 下載nvidia-docker的安裝包 https://github.com/NVIDIA/nvidia-docker/releases
   #deb型別: https://github.com/NVIDIA/nvidia-docker/releases/download/v1.0.0/nvidia-docker_1.0.0-1_amd64.deb
 8. sudo dpkg -i nvidia-docker_1.0.0-1_amd64.deb
 ### 有一點需要注意docker默然使用root所以docker的每個命令需要sudo官方解釋是安全，我們自己用則無妨
 # 建立docker組
    sudo groupadd docker
 # 將當前使用者加入docker組
    sudo gpasswd -a ${USER} docker
 # 重新啟動docker服務（下面是CentOS7的命令）
    sudo systemctl restart docker
 # .重新整理Docker成員
    newgrp - docker
 # 之後使用docker就不用sudo了，稍微方便點

docker hub

cuda-caffe
—Ubuntu Core 14.04 + CUDA 8.0 + cuDNN v5 + Caffe. Includes Python interface.
Requirements
—NVIDIA Docker - see requirements for more details.
Usage
—Use NVIDIA Docker: nvidia-docker run -it kaixhin/cuda-caffe.
這個映象的tags有6.5 7.0 7.5 8.0的cuda版本，基本滿足使用

 # 8.0意為cuda8.0，根據自己的需要修改，這個下載比較大所以很慢有空我會把我下好的映象放到國內的百度雲盤
   docker pull kaixhin/cuda-caffe:8.0 
 # 下載後使用下面命令就會看到你已load的映象，注意docker預設在/目錄，所以注意/分割槽的大小
   docker images
 # REPOSITORY   TAG   IMAGE   ID   CREATED   SIZE
 # xxx          8.0    xxx     x     xxx       x
   nvidia-docker run -ti -p 宿主埠:docker容器埠 -v 宿主機地址:docker容器內地址 image名字(或者ID):8.0 
   #不加tag預設是latest
   # -t 以為tty -i 意為可互動 如果-d就直接進後臺 -v 就是檔案對映可以用於宿主機和docker容器檔案傳輸，-p是埠對映待會會用到

到此處基本已經可以用終端來在容器中來跑你的網路了，但是有時候需要matlab或者需要個桌面環境比較順手，這個時候就需要給容器裡的linux裝個桌面然後傳輸出來

安裝LXDE桌面 VNCserver

 # 先對映好埠進入容器
 nvidia-docker run -ti -p 5901:5901 kaixhin/cuda-caffe:8.0 
 # 安裝lxde vncserver
 sudo apt-get update
 sudo apt-get install xorg lxde-core tightvncserver
 # 或者到https://www.realvnc.com/download/vnc/linux/下載vncserver的deb包安裝
 # 此映象預設root使用者，且沒有設定USER和HOME環境變數啟動vncserver時會有錯誤，所以先執行以下命令
  vim /root/.bashrc 
 # 在最後加入以下程式碼後儲存
  export USER=root
  export HOME=/root
 # 然後立即生效該環境變數
  source /root/.bashrc
 # 此處需要設定密碼，還有一個view-only密碼可選否
  vncserver -geometry 1024x768 :1 # 如果你啟動時對映的是590n，那麼此處就是vncserver :n
 # 其他(重新啟動vncserver)
  vncserver -kill :1 && rm /tmp/.X1-lock && rm /tmp/.X1-lock
  vncserver -geometry 2400x1300 :1

通過VNCviewer連線容器內桌面

下載VNCviwer https://www.realvnc.com/download/viewer/
然後輸入地址：127.0.0.1:5901 然後輸入你剛才設定的密碼就成功了
lxde桌面調節解析度
1. sudo vim /etc/xdg/lxsession/LXDE/autostart
最後一行新增
2. @xrandr –auto –output DVI-1 –primary –mode 1680x1050 –left-of DVI-0

docker的其他

 # 檢視正在執行的容器
  docker ps
 # 刪除所有容器
  docker rm `docker ps -a |awk '{print $1}' | grep [0-9a-z]`
 #  儲存容器當前的狀態到一個映象
  docker commit -m "test" 容器ID 新映象名字
 # 儲存映象到一個檔案
  docker save 映象名字>xxx.tar
 # 載入一個映象檔案tar
  docker load < xxx.tar
 # 檢視載入的映象
  docker images
 # 進入掛起的容器
  nvidia-docker exec -it 9f /bin/bash 
 # 重啟退出的容器
  nvidia-docker restart f9f

nvidia-docker快速遷移caffe環境（GPU+VNCserver+lxde桌面）

有時候我們自己在本機上費力搭建了很複雜的環境（cuda(5,6,7,8)+cudnn+opencv(2,3)+matlab等等其他依賴），我們想遷移這個環境到另一臺機器上就需要重新安裝一遍，如果另

使用Docker快速部署ELK環境（最新5.5.1版本）

在Linux伺服器上安裝Docker以後，Pull相關的官方Docker映象： docker pull docker.elastic.co/elasticsearch/elasticsearch:5.5.1 docker pull docker.elast

Docker搭建Java Web環境（Centos6.8+JDK8+tomcat8）

上一篇blog分享了怎麼利用centos伺服器安裝docker容器，簡單介紹了下docker的相關命令及例項。就想著通過docker搭建一個適合Java執行的平臺，結合網上的資料，最終順利完成。

在windows環境裡，用Docker搭建Redis開發環境（新書第一個章節）

大家都知道高併發分散式元件的重要性，而且如果要進大廠，這些技術不可或缺。但這些技術的學習難點在於，大多數專案裡的分散式元件，都是搭建在Linux系統上，在自己的windows機器上很難搭建開發環境，如果無法搭建開發環境，就無法實際操練，而單靠背理論題，是無法通過面試的。

windows下caffe-ssd（GPU版）搭建測試環境

一、準備CUDA、CuDNN CUDA安裝： 1、雙擊下載好的exe檔案，選擇路徑，開始安裝 2、系統檢查 3、同意條款並繼續 4、選擇自定義安裝 5、記好下面三個安裝位置，一直下一步，直到安裝完成 CuDNN安裝： 1、解壓下

快速恢復開發環境（系統還原後的思考，附上eclipse註釋的xml配置文件）

技術 get 心情 created ret chrome瀏覽器思考 locks 喜歡 1、Eclipse/Myeclipse的工作空間，不能放在系統盤除非你的項目都有實時的雲同步或SVN等，才能放在系統固態盤，不然你享受快速啟動項目的同時，也需要承擔系統奔潰後找不回項

Docker 快速搭建Caffe平臺

（建議在翻牆的情況下進行，不然更新源的時候會出現無法下載的問題）點選下載所需檔案 https://github.com/BVLC/caffe/tree/master/docker 1.使用docker下載Caffe映象 docker build -t caffe:cpu s

雲端計算生產環境架構效能調優和遷移套路總結（以 AWS 為例）

最近完成了一個雲端計算平臺應用的架構調優。客戶是一個 Wordpress + MySQL 的站點，剛從本地資料中心遷移到了 AWS，由於團隊技能限制，無法充分發揮雲端計算的優勢。加之應用程式在夜間高流量時段崩潰，架構優化和遷移迫在眉睫。本文以這次架構遷移經驗為例，介紹雲端計算架構優化遷移的基本步驟和

使用Docker快速搭建生產環境

Docker安裝 CentOS 6.5: 1 2 yum install -y docker-io service docker start 下載映象配置使用國內映象：修改Docker配置檔案/etc/default/

深度學習caffe(4)——caffe配置（GPU）

電腦：win7 64位，NVIDIA GeForce GTX1080 Ti，visual studio 2013. 深度學習caffe(1)——windows配置caffe（vs2013+python+matlab）(cpu)：系統：window，系統版本是7

Docker+Jenkins持續整合環境（1）使用Docker搭建Jenkins+Docker持續整合環境

來源：https://www.cnblogs.com/xiaoqi/p/docker-jenkins-cicd.html 本文介紹如何通過Jenkins的docker映象從零開始構建一個基於docker映象的持續整合環境，包含自動化構建、釋出到倉庫\並部署上線。 0. 前置條件伺服器安

Win10+VS2015+Anaconda3（GPU）+Caffe安裝（之前已安裝TensorFlow）

我之前安裝了TensorFlow，最近因為學習需要Caffe。不知兩者是否可以同時安裝，於是谷歌求解，花費一天時間採坑，慶幸的是終於成功安裝。一、軟體下載1）VS2015社群版2）Anaconda3-4.2.0-Windows-x86_64（python3.5）3）Cuda8

使用docker快速搭建執行環境

最近在搭建虛擬機器上的執行環境，最開始是按照傳統方法一個一個安裝軟體，一大堆軟體裝下確實是挺費時間的。現在容器技術非常的火，於是就去看了一下docker，完全能夠滿足我的需求，省時省力，何樂而不為？什麼是docker？簡單的說，Docker是一個基

基於docker-compose搭建laravel環境（nodejs+npm+bower）

laradock資源連結：https://github.com/laradock/laradock laradock基於docker-compose實現了整合化的laravelve環境搭建，提供了nginx, hhvm,php-fpm, mysql, redis, pos

Docker：搭建開發環境（執行Eclipse等圖形化介面程式）

Docker搭建開發環境基本說明兩個月前的時候自己提出想通過Docker來搭建開發環境（http://blog.csdn.net/zhaodedong/article/details/46549279），能方便地供實驗室的其他同學使用。我所謂的開發環

在阿里雲伺服器上快速搭建JavaWeb環境（安裝JDK、Tomcat、MySQL）+Intellij IDEA遠端部署除錯tomcat

首先介紹一下我的的伺服器的系統是Ubuntu 16.04 64位 ide用了Intellij IDEA JDK8 Tomcat8 MySQL5.7 一、先下載JDK 8 1、JDK8 # sudo apt-get install openjdk-8

如何快速在macOS上搭建Flutter開發環境（編輯器Android Studio）

注：1、以下教程中如果出現下載失敗的情況，請掛VPN嘗試。 2、安裝過程中有些步驟等待會比較漫長，請一定，要有耐心！！！ Step 1 AS plugs庫下載Flutter和Dart外掛搜尋Flutter即可，安裝時會提示你需要同時安裝Dart外掛，也就是說

【Rocketmq】通過 docker 快速搭建 rocketmq 環境

1. 安裝 Namesrv 拉取映象 docker pull rocketmqinc/rocketmq:4.4.0` 啟動容器 docker run -d -p 9876:9876 -v {RmHome}/data/namesrv/logs:/root/logs -v {RmHome}/data/name

使用docker快速搭建hive環境

> 記錄一下使用docker快速搭建部署hive環境 [toc] ## 寫在前面想練練Hive SQL，但是沒有hive shell環境。現在只有一臺**空的CentOS 7**機子，一想要弄jdk、hadoop、mysql、hive就頭疼。於是在網上找了找，發現用docker部署hive會

php之快速入門學習-16（PHP 魔術變量）

如果區分完整快速入門成員才會有時輸出結果腳本 PHP 魔術變量 PHP 向它運行的任何腳本提供了大量的預定義常量。不過很多常量都是由不同的擴展庫定義的，只有在加載了這些擴展庫時才會出現，或者動態加載後，或者在編譯時已經包括進去了。有八個魔術常量它們

nvidia-docker快速遷移caffe環境（GPU+VNCserver+lxde桌面）

docker和nvidia-docker的區別

nvidia-docker安裝(ubuntu為例)

docker hub

安裝LXDE桌面 VNCserver

通過VNCviewer連線容器內桌面

docker的其他

相關推薦