1. 程式人生 > >深度學習caffe平臺-----裁剪層(Crop Layer)引數及引數詳解

深度學習caffe平臺-----裁剪層(Crop Layer)引數及引數詳解

       在Fully Convolutional Networks(FCN)中,會用到Crop 層,他的主要作用是進行裁切。下面我們舉一個例子來說明如何使用Crop 層。

  Caffe中的資料是以 blobs形式存在的,blob是四維資料,即 (Batch size, number of Chennels, Height, Width)=(N, C, H, W)。---(0,1,2,3)

Crop層的輸入(bottom blobs)有兩個,讓我們假設為A和B,輸出(top)為C。

  • A是要進行裁切的bottom,他的size是 (20,50,512,512)
  • B是裁切的參考輸入,他的size是(20,10,256,256)
  • C是輸出(top blob),由A裁切而來,那麼他的size是(20,10,256,256)

  在這個例子中,軸0的維度不變,我們只需要裁切blob的軸1,2,3,所以我們設定axis=1,代表我們將會裁切軸1和它之後的所有軸。

  有兩個裁切模式:

模式1---給出3個offsets,每個針對一個dimension,offset=(25,128,128)

  • axis=1,offset=(25,128,128)
  • crop operation: C = A[: , 25: 25+B.shape[1] , 128: 128+B.shape[2] , 128: 128+B.shape[3] ]
  • 也就是說,對於A的軸1,對稱裁切了25-35
  • 對稱裁切:offset = (Original_length - desired length ) / 2

模式2---給出1個offset,適用於三個dimension,offset=25

  • 那麼就相當於模式1 的 offset=(25,25,25)

  模式1的prototxt寫法如下:

1 2 3 4 5 6 7 8 9 10 11 12 13 layer { name: "crop_layer" type: "Crop" bottom: "A" bottom: "B" top: "C" crop_param { axis: 1 offset: 25 offset: 128 offset: 128
} }

相關推薦

深度學習caffe平臺-----裁剪Crop Layer)引數引數

       在Fully Convolutional Networks(FCN)中,會用到Crop 層,他的主要作用是進行裁切。下面我們舉一個例子來說明如何使用Crop 層。   Caffe中的資料是以 blobs形式存在的,blob是四維資料,即 (Batch s

深度學習caffe平臺-----啟用Activiation Layers)引數引數

 在啟用層中,對輸入資料進行啟用操作(實際上就是一種函式變換),是逐元素進行運算的。從bottom得到一個blob資料輸入,運算後,從top輸入一個blob資料。在運算過程中,沒有改變資料的大小,即輸入和輸出的資料大小是相等的。 輸入:n*c*h*w 輸出:n*c*

深度學習caffe平臺--製作自己.lmdb格式資料集分類標籤檔案

caffe對於訓練資料格式,支援:lmdb、h5py……,其中lmdb資料格式常用於單標籤資料,像分類等,經常使用lmdb的資料格式。對於迴歸等問題,或者多標籤資料,一般使用h5py資料的格式。當然好像還有其它格式的資料可用,本文就主要針對lmdb資料格式的製作方法,進行簡

Ubuntu14.04上深度學習Caffe庫安裝指南CUDA7.5 + opencv3.1)

Ubuntu14.04上Caffe安裝指南 安裝的準備工作 首先,安裝官方版Caffe時,如果要使用Cuda,需要確認自己確實有NVIDIA GPU。 安裝Ubuntu時,將/boot 分割槽分大概200M左右,太小了會導致升級系統時/boot空間不足

深度學習Caffe平臺安裝——Ubuntu安裝CPU模式的caffe

先將Makefile.config檔案中OPENCV_VERSION :=3 註釋掉,只修改USE_OPENCV := 1修改後的結果:USE_OPENCV := 1#OPENCV_VERSION := 3在caffe根目錄下,找到Makefile檔案,開啟檔案查詢“Derive include and li

Linux 學習之路二):使用者許可權

作業: 1.ls 命令是否可以顯示某目錄的整體大小,即包括其內部的所有檔案的整體大小? 可以,使用ls -s xxx 2.通過幫助手冊,學習使用du命令: # du 估計檔案空間使用量 ​ -s 分割資料夾,不包括子目錄大小 ​ -h 以可讀格式展示

Jmeter學習—005—JMeter命令列非GUI模式)執行

背景說明:JMeter執行方式有2種,一種是GUI模式,一種是NO-GUI模式。GUI模式就是介面模式,NO-GUI模式就是命令列模式。介面模式主要用來編寫和除錯指令碼用的,專案的真正執行最好是採用命令列模式,因為採用命令列模式可以和持續整合或者其它框架進行對接,做成自動

Liunx:環境基礎開發工具使用總結基本操作命令使用

目錄 1vim的基本概念 2vim的基本操作 3vim正常模式命令集 1:插入模式 2:移動游標 3:刪除文字 4:複製 5:替換 6:撤銷 7:更改 8:跳到指定行 4vim末行模式命令集 分屏操作 編譯器的使用 1:背景知識 2:g

Nginx狀態資訊status)配置資訊

nginx狀態資訊功能的介:   Nginx 在編譯安裝 Nginx 的時候新增 --with-http_stub_status_module 引數,其功能是記錄 Nginx 的基本訪問狀態資訊,讓使用者瞭解 Nginx 的工作狀態, 可以用 /application/nginx/sbin/nginx -

Nginx訪問日誌access_log)配置資訊

#    log_format  main  '$remote_addr - $remote_user [$time_local] "$request" ' #                      '$status $body_bytes_sent "$http_referer" ' #    

gdb引數命令 已整理) core dump除錯

       -e file               在適當時候把File作為可執行的檔案執行,來檢測與core dump結合的資料。        -se File               從File讀取符號表並把它作為可執行檔案。        -core File        -c File

Nginx URL重寫rewrite)配置資訊

Nginx URL重寫(rewrite)配置及資訊詳解     URL重寫有利於網站首選域的確定

深度學習Caffe實戰9)Windows 平臺caffe用MATLAB介面實現訓練網路和測試

上一篇介紹了網路協議中各個引數的作用,知道了各個引數的作用,想必應該可以嘗試修改網路結構了。前幾篇部落格介紹的都是用命令列訓練和測試網路,這篇部落格介紹如何用MATLAB介面實現訓練和測試網路,window平臺下caffe使用者本來就少,這方面的資料更少了,下一

深度學習Caffe實戰筆記21)Windows平臺 Faster-RCNN 訓練好的模型測試資料

前一篇部落格介紹瞭如何利用Faster-RCNN訓練自己的資料集,訓練好會得到一個模型,這篇部落格介紹如何利用訓練好的模型進行測試資料。 1、訓練好的模型存放位置 訓練好的模型存放在faster_rcnn-master\output\faster_rcnn_

深度學習Caffe實戰筆記20)Windows平臺 Faster-RCNN 訓練自己的資料集

1、把自己的資料集放到Faster-master中 我覺得這個過程是最重要的一個過程吧,博主在這裡跳了很多的坑,最後找到了一個非常簡單高效的方法。不用修改任何檔案,就可以輕鬆實現載入自己的資料集。 在faster_rcnn-master資料夾下,有一個d

深度學習Caffe實戰筆記5)Windows caffe平臺跑Siamese mnist資料集

前幾篇部落格介紹了環境搭建,caffe跑lenet,alexnet,cifar10,基礎的一些操作都介紹的很詳細了。這篇部落格介紹如何使用Siamese網路跑mnist資料集,下一篇介紹如何用Siamese網路跑自己的資料集。說到Siamese網路,這次不哭了,

深度學習Caffe實戰筆記18)Windows平臺 Faster-RCNN 環境配置

好久不寫部落格了,因為前一段時間博主身體抱恙,感觸頗多。。。。。。都說windows平臺做caffe和tensorflow坑多,博主沒有太多優點,唯獨的一個優點就是不服輸,Windows平臺雖然坑多,但是填坑也是蠻有意思的一件事情。另外,在Siamese網路訓練

【4】Caffe學習系列:啟用Activiation Layers)引數

在啟用層中,對輸入資料進行啟用操作(實際上就是一種函式變換),是逐元素進行運算的。從bottom得到一個blob資料輸入,運算後,從top輸入一個blob資料。在運算過程中,沒有改變資料的大小,即輸入和輸出的資料大小是相等的。 輸入:n*c*h*w 輸出:n*c*h*w 常用的啟用函式有

【3】Caffe學習系列:視覺Vision Layers)引數

所有的層都具有的引數,如name, type, bottom, top和transform_param. 本文只講解視覺層(Vision Layers)的引數,視覺層包括Convolution, Pooling, Local Response Normalization (LRN),

深度學習caffe(4)——caffe配置GPU)

電腦:win7  64位,NVIDIA GeForce GTX1080 Ti,visual studio 2013. 深度學習caffe(1)——windows配置caffe(vs2013+python+matlab)(cpu): 系統:window,系統版本是7