空間變換（spatial transform）：可設定的引數有是否映象、是否旋轉、是否縮放、是否translate（包括直接指定或只指定x或y一個方向）；
顏色變換（chromatic transform）：可設定的引數有亮度、gamma、對比度、顏色；
效果變換（effect transform）：可設定的引數有霧面尺寸（fog size）、霧面程度（fog amount）、運動模糊角度、運動模糊尺寸、陰影角度、陰影距離、陰影強度、噪聲；

顏色特徵變換（chromatic eigen transform）。

呼叫方式

呼叫方式1：層中定義擴張引數

layer {
  name: "DataAugmentation"
  type: "DataAugmentation"
  bottom: "input_blob"
  top: "output_blob1"
  top: "output_blob2"
  propagate_down: false 
  augmentation_param {
    max_multiplier: 1
    augment_during_test: false
    recompute_mean: 1000
    mean_per_pixel: false
    translate {
      rand_type: "uniform_bernoulli"
      exp: false
      mean: 0
      spread: 0.4
      prob: 1.0
    }
    zoom {
      rand_type: "uniform_bernoulli"
      exp: true
      mean: 0.2
      spread: 0.4
      prob: 1.0
    }
    squeeze {
      rand_type: "uniform_bernoulli"
      exp: true
      mean: 0
      spread: 0.3
      prob: 1.0
    }
    lmult_pow {
      rand_type: "uniform_bernoulli"
      exp: true
      mean: -0.2
      spread: 0.4
      prob: 1.0
    }
    lmult_mult {
      rand_type: "uniform_bernoulli"
      exp: true
      mean: 0.0
      spread: 0.4
      prob: 1.0
    }
    lmult_add {
      rand_type: "uniform_bernoulli"
      exp: false
      mean: 0
      spread: 0.03
      prob: 1.0
    }
    sat_pow {
      rand_type: "uniform_bernoulli"
      exp: true
      mean: 0
      spread: 0.4
      prob: 1.0
    }
    sat_mult {
      rand_type: "uniform_bernoulli"
      exp: true
      mean: -0.3
      spread: 0.5
      prob: 1.0
    }
    sat_add {
      rand_type: "uniform_bernoulli"
      exp: false
      mean: 0
      spread: 0.03
      prob: 1.0
    }
    col_pow {
      rand_type: "gaussian_bernoulli"
      exp: true
      mean: 0
      spread: 0.4
      prob: 1.0
    }
    col_mult {
      rand_type: "gaussian_bernoulli"
      exp: true
      mean: 0
      spread: 0.2
      prob: 1.0
    }
    col_add {
      rand_type: "gaussian_bernoulli"
      exp: false
      mean: 0
      spread: 0.02
      prob: 1.0
    }
    ladd_pow {
      rand_type: "gaussian_bernoulli"
      exp: true
      mean: 0
      spread: 0.4
      prob: 1.0
    }
    ladd_mult {
      rand_type: "gaussian_bernoulli"
      exp: true
      mean: 0.0
      spread: 0.4
      prob: 1.0
    }
    ladd_add {
      rand_type: "gaussian_bernoulli"
      exp: false
      mean: 0
      spread: 0.04
      prob: 1.0
    }
    col_rotate {
      rand_type: "uniform_bernoulli"
      exp: false
      mean: 0
      spread: 1
      prob: 1.0
    }
    crop_width: 960
    crop_height: 256
    chromatic_eigvec: 0.51
    chromatic_eigvec: 0.56
    chromatic_eigvec: 0.65
    chromatic_eigvec: 0.79
    chromatic_eigvec: 0.01
    chromatic_eigvec: -0.62
    chromatic_eigvec: 0.35
    chromatic_eigvec: -0.83
    chromatic_eigvec: 0.44
    noise {
      rand_type: "uniform_bernoulli"
      exp: false
      mean: 0.03
      spread: 0.03
      prob: 1.0
    }
  }
}

呼叫方式2：通過其他資料擴張層提供引數

layer {
  name: "DataAugmentation"
  type: "DataAugmentation"
  bottom: "input_blob"
  bottom: "input_augmented_blob"
  top: "output_blob"
  propagate_down: false 
  propagate_down: false 
  augmentation_param {
    max_multiplier: 1
    augment_during_test: false
    recompute_mean: 1000
    mean_per_pixel: false
    crop_width: 960
    crop_height: 256
    chromatic_eigvec: 0.51
    chromatic_eigvec: 0.56
    chromatic_eigvec: 0.65
    chromatic_eigvec: 0.79
    chromatic_eigvec: 0.01
    chromatic_eigvec: -0.62
    chromatic_eigvec: 0.35
    chromatic_eigvec: -0.83
    chromatic_eigvec: 0.44
  }
}

data_augmentation_layer.hpp

定義了層所需要的變數和函式，其中由於處理的是原始影象資料，因此不支援反向計算：

virtual void Backward_cpu(const vector<Blob<Dtype>*>& top,
                              const vector<bool>& propagate_down, const vector<Blob<Dtype>*>& bottom)  { for(int i=0; i<propagate_down.size(); i++) if(propagate_down[i]) LOG(FATAL) << "DataAugmentationLayer cannot do backward."; return; }
virtual void Backward_gpu(const vector<Blob<Dtype>*>& top,
                              const vector<bool>& propagate_down, const vector<Blob<Dtype>*>& bottom)  { for(int i=0; i<propagate_down.size(); i++) if(propagate_down[i]) LOG(FATAL) << "DataAugmentationLayer cannot do backward."; return; }

data_augmentation_layer.cpp

資料分割的計算和處理只在gpu上執行，因此cpp檔案僅定義資料及引數的讀取和必要的尺寸設定，具體的分割方式在cu檔案中定義。

LayerSetUp

用於從prototxt檔案中讀取層的設定引數。

template <typename Dtype>
void DataAugmentationLayer<Dtype>::LayerSetUp(const vector<Blob<Dtype>*>& bottom,
      const vector<Blob<Dtype>*>& top)
{
  // TODO This won't work when applying a net to images of size different from what the net was trained on
  aug_ = this->layer_param_.augmentation_param();			//讀取資料擴張層的引數到aug_中
  this->layer_param_.set_reshape_every_iter(false);
  LOG(WARNING) << "DataAugmentationLayer only runs Reshape on setup";
  if (this->blobs_.size() > 0)
    LOG(INFO) << "Skipping data mean blob initialization";
  else {
    if (aug_.recompute_mean()) {
      LOG(INFO) << "Recompute mean";
      this->blobs_.resize(3);
      this->blobs_[1].reset(new Blob<Dtype>());
      this->layer_param_.add_param();
      this->layer_param_.mutable_param(this->layer_param_.param_size()-1)->set_lr_mult(0.);
      this->layer_param_.mutable_param(this->layer_param_.param_size()-1)->set_decay_mult(0.);
      this->blobs_[2].reset(new Blob<Dtype>());
      this->layer_param_.add_param();
      this->layer_param_.mutable_param(this->layer_param_.param_size()-1)->set_lr_mult(0.);
      this->layer_param_.mutable_param(this->layer_param_.param_size()-1)->set_decay_mult(0.);      
    } 
    else {  
      LOG(INFO) << "Do not recompute mean";
      this->blobs_.resize(1);
    }
    this->blobs_[0].reset(new Blob<Dtype>(1, 1, 1, 1));      
    // Never backpropagate
    this->param_propagate_down_.resize(this->blobs_.size(), false);
    this->layer_param_.add_param();
    this->layer_param_.mutable_param(this->layer_param_.param_size()-1)->set_lr_mult(0.);
    this->layer_param_.mutable_param(this->layer_param_.param_size()-1)->set_decay_mult(0.); 
//     LOG(INFO) << "DEBUG: this->layer_param_.param_size()=" << this->layer_param_.param_size();
//     LOG(INFO) << "DEBUG: Writing layer_param";
    WriteProtoToTextFile(this->layer_param_, "/misc/lmbraid17/sceneflownet/dosovits/matlab/test/message.prototxt");
//     LOG(INFO) << "DEBUG: Finished writing layer_param";
  } 
}

Reshape

用於設定輸出的尺寸等必要資訊。

template <typename Dtype>
void DataAugmentationLayer<Dtype>::Reshape(const vector<Blob<Dtype>*>& bottom,
      const vector<Blob<Dtype>*>& top)
{
	//檢查輸入和輸出的blob個數是否滿足函式要求
    LOG(WARNING) << "Reshape of Augmentation layer should only be called once? Check this";
    CHECK_GE(bottom.size(), 1) << "Data augmentation layer takes one or two input blobs.";
    CHECK_LE(bottom.size(), 2) << "Data augmentation layer takes one or two input blobs.";
    CHECK_GE(top.size(), 1) << "Data augmentation layer outputs one or two output blobs.";
    CHECK_LE(top.size(), 2) << "Data augmentation layer outputs one or two output blobs.";

	//從輸入中讀取尺寸引數
    const int num = bottom[0]->num();
    const int channels = bottom[0]->channels();
    const int height = bottom[0]->height();
    const int width = bottom[0]->width();

    output_params_=(top.size()>1);
    input_params_=(bottom.size()>1);		//用於判斷是層內定義擴張引數還是從另一個數據擴張層獲得
    aug_ = this->layer_param_.augmentation_param();
    discount_coeff_schedule_ = this->layer_param_.coeff_schedule_param();

    //判斷層中是否給出了要擷取的寬和高：如果給出，進行裁減（要求裁減後的尺寸小於原尺寸）；如果沒有，保持原尺寸。
    do_cropping_ = (aug_.has_crop_width() && aug_.has_crop_height());
    if (!do_cropping_)
    {
        cropped_width_ = width;
        cropped_height_ = height;
        LOG(WARNING) << "Please enter crop size if you want to perform augmentation";
    }
    else
    {
        cropped_width_ = aug_.crop_width();    CHECK_GE(width, cropped_width_)   << "crop width greater than original";
        cropped_height_ = aug_.crop_height();  CHECK_GE(height, cropped_height_) << "crop height greater than original";
    }

    //給定輸出的尺寸
    top[0]->Reshape(num, channels, cropped_height_, cropped_width_);

    //確定需要分割的引數
    AugmentationCoeff coeff;
    num_params_ = coeff.GetDescriptor()->field_count();

    //如果這一層的引數是由另一個數據擴張層提供的，則讀取這個（第二個）輸入blob
    if (input_params_) {		//如果有兩個輸入，則根據第二個輸入確定引數
        LOG(INFO) << "Receiving " << num_params_ << " augmentation params";
        all_coeffs_.ReshapeLike(*bottom[1]);		//ReshapeLike：與後面的blob維度相同
    } else		//否則，新建引數
        all_coeffs_.Reshape(num, num_params_, 1, 1); //create

    //如果要求有超過兩個輸出，第二個輸出根據前面的要求確定尺寸
    if (output_params_) {
        top[1]->ReshapeLike(all_coeffs_);
        LOG(INFO) << "Emitting " << num_params_ << " augmentation params";
    }

    //一個batch需要用的引數變換矩陣快取
    coeff_matrices_.reset(new SyncedMemory(num * sizeof(typename AugmentationLayerBase<Dtype>::tTransMat)));
    
    coeff_chromatic_.reset(new SyncedMemory(num * sizeof(typename AugmentationLayerBase<Dtype>::tChromaticCoeffs)));
    coeff_chromatic_eigen_.reset(new SyncedMemory(num * sizeof(typename AugmentationLayerBase<Dtype>::tChromaticEigenCoeffs)));
    coeff_effect_.reset(new SyncedMemory(num * sizeof(typename AugmentationLayerBase<Dtype>::tEffectCoeffs)));

    chromatic_eigenspace_.reset(new SyncedMemory(sizeof(typename AugmentationLayerBase<Dtype>::tChromaticEigenSpace)));

    //計算資料均值
    if (aug_.recompute_mean()) {		//如果需要重新計算真值
      ones_.Reshape(1, 1, cropped_height_, cropped_width_);
      caffe_set(ones_.count(), Dtype(1), ones_.mutable_cpu_data());
      this->blobs_[1]->Reshape(1, channels, cropped_height_, cropped_width_);
      this->blobs_[2]->Reshape(1, channels, 1, 1);
    }
    else if(aug_.mean().size()==3 && !aug_.mean_per_pixel())
    {
      ones_.Reshape(1, 1, cropped_height_, cropped_width_);
      caffe_set(ones_.count(), Dtype(1), ones_.mutable_cpu_data());

      LOG(INFO) << "Using predefined per-pixel mean from proto";
      pixel_rgb_mean_from_proto_.Reshape(1,3,1,1);
      for(int i=0; i<3; i++)
          pixel_rgb_mean_from_proto_.mutable_cpu_data()[i]=aug_.mean().Get(i);
    }
    
    noise_.reset(new SyncedMemory(top[0]->count() / top[0]->num() * sizeof(Dtype)));

    *(this->blobs_[0]->mutable_cpu_data()) = 0;
    
//     LOG(INFO) << "DEBUG: Reshape done";
}

data_augmentation_layer.cu

用於定義在gpu上的運算。

Forward_gpu

首先做擴張前的檢查工作：

確定輸入和輸出的尺寸；
檢查輸入與輸出的num是否相等；
檢查是否有NAN和特別大的值。

隨後進行擴張（程式設定只有在設定了擷取的條件下擴張資料）：

如果沒有輸入的擴張引數，就根據要求（層引數）生成一組，並將所做的變換記錄在log中；
依照引數求得變換矩陣；
根據需要，依變換矩陣擴張資料。

如果沒有設定擷取條件，則直接將輸入複製給輸出。

對擴張後的資料進行歸一化處理（減去均值）。

DispNet中Caffe自定義層解讀（二）——DataAugmentation

DispNet中Caffe自定義層解讀（二）——DataAugmentation 這一系列博文記錄了博主在學習DispNet過程中遇到的自定義Caffe層的筆記。這一部分是DataAugmentation層，其主要功能是：根據要求對輸入的資料進行擴張，從而從資料的角度上儘量緩解過擬合

DispNet中Caffe自定義層解讀（三）—— GenerateAugmetationParamters

DispNet中Caffe自定義層解讀（三）—— GenerateAugmetationParamters 這一系列博文記錄了博主在學習DispNet過程中遇到的自定義Caffe層的筆記。這一部分是GenerateAugmentationParameters層，其主要功能是：。

DispNet中Caffe自定義層解讀（一）—— CustomData

DispNet中Caffe自定義層解讀（一）—— CustomData 這一系列博文記錄了博主在學習DispNet過程中遇到的自定義Caffe層的筆記。這一部分是CustomData層，其主要功能是：讀取資料庫中的LMDB型別資料，並將其隨機排布後存入top。更新於2018.10.2

WPF自定義控件（二）の重寫原生控件樣式模板

我們 new 所有代碼 microsoft tps ron 例子 family 開發過程中，我們有時候用WPF原生的控件就能實現自己的需求，但是樣式、風格並不能滿足我們的需求，那麽我們該怎麽辦呢？----自定義樣式與模板。一、樣式在WPF中我們可以

按鈕配置之自定義按鈕使用（二）——JEPLUS軟件快速開發平臺

bottom vpd 開發平臺 rem 按鈕 ros cto -c spa JEPLUS按鈕配置之自定義按鈕使用（二）之前的一篇筆記講的是在列表上添加自定義按鈕來完成自己的業務需求，今天這篇筆記就主要講一下如何在表

java自定義註解學習（二）_註解詳解

上篇文章，我們簡單的實現了一個自定義註解，相信大家對自定義註解有了個簡單的認識，這篇，這樣介紹下註解中的元註解和內值註解整體圖示內建註解 @Override 重寫覆蓋這個註解大家應該經常用到，主要在子類重寫父類的方法，比如toString()方法 package com.kevin.demo;

Android自定義View初探（二）——仿360垃圾清理

明天就是五一勞動節了，在這裡先祝各位程式猿勞動節快樂，別在加班了！自從嘗試過寫自定義View（Android自定義View初探（一）——餅圖）之後，每當看到別人的應用時，總是在想別人的實現方式，或許，這就是程式猿的悲哀吧O(∩_∩)O~。前兩天就想嘗試去

自定義Gradle外掛（二）

上一篇部落格已經介紹瞭如何實現簡單的自定義gradle外掛，今天介紹如何自定義Task。一、自定義Task 1、直接沿用上一篇的程式碼，copy一份改名CustomPluginTask 在plugin\src\main\groov

編寫Qt Designer自定義控制元件（二）——編寫自定義控制元件介面

既然是控制元件，就應該有介面，預設生成的控制元件類只是一個繼承了QWidget的類，如下： #ifndef LOGLATEDIT_H #define LOGLATEDIT_H #include <QWidget> class LogLat

基於Android搭建tensorflow lite,實現官網的Demo以及執行自定義tensorflow模型（二）

基於上一篇在android studio 中已經佈置好的環境進行開發。這篇文章是基於手寫識別的例子，在tensorflow中搭建一個簡單的BP神經網路，在實現手寫數字的識別，然後把這個網路生成檔案，在android的tensorflow lite中執行。一在tensorfl

Android自定義控制元件（二）-給自定義控制元件新增事件

在這篇部落格中主要講解給Android自定義控制元件新增點選事件，實現可以按住百分比圓圈在螢幕上進行拖動圓圈的功能。分兩部分講，第一部分是獲取自定義控制元件的座標，第二部分是重新繪製控制元件。第一部分：獲取自定義控制元件座標首先看一張圖，這是自定義控制元件中獲

百度地圖JavaScript API 學習之自定義標註圖示（二）

地圖繪製之新增自定義標註圖示（二）官方提供了兩種方法來自定義標註圖示：通過引數MarkerOptions的icon屬性進行設定使用Marker.setIcon()方法。第二

自定義控制元件（二）Paint，Canvas 基礎用法

本篇部落格繼續學習 Paint 和 Canvas 的基礎用法，上一篇部落格學習了基礎API使用（基礎幾何圖形，Path 路徑），接下來學習繪製文字和繪製圖片上一篇文章，沒看的有必要先了解一下：自定義控制元件（一）Paint，Canvas 基礎用

Spring Security 自定義登入認證（二）

一、前言本篇文章將講述Spring Security自定義登入認證校驗使用者名稱、密碼，自定義密碼加密方式，以及在前後端分離的情況下認證失敗或成功處理返回json格式資料溫馨小提示：Spring Security中有預設的密碼加密方式以及登入使用者認證校驗，但小編這裡選擇自定義是為了方便以後業務擴充套件，

在 Windows Server Container 中運行 Azure Storage Emulator（二）：使用自定義的 SQL Server Instance

manage span contain target ros 結果 images 兩種方法 ini 　　上一章，我們解決了 Azure Storage Emulator 自定義監聽地址的問題，這遠遠不夠，因為在我們 DEV/QA 環境有各自的 SQL Server Inst

FastReport調用Delphi中的自定義函數（人民幣大寫金額）mtm

分享圖片人民幣 IT report text 定義 eat fas func 1. 在 FormCreate 中向FastReprot添加函數 (fPrint)窗口 procedure TfPrint.FormCreate(Sender: TObject); fr

Django 框架中的自定義模板標籤（template.Library()）

某一些標籤（例如：選單欄、css、JS、以及一些複雜計算後的資料等）需要我們自定義。然後再在指定的html中引用並顯示。之所以要用到標籤，主要作用就是想讓一些內容在多個模板（HTML）中都要有，比如選單欄。我們絕對不想在每個檢視函式（views中）都寫一次這些變數內容。即每個頁面

Emoji開源專案解讀（二）自定義表情

介紹上一節呢，我們解讀了一個系統Emoji表情，這節呢，我們談談自定義表情，如QQ、微信等，正好前兩天看到一個仿QQ的一個應用，雖然還是有許多需要完善的地方，不過對於自定義Emoji表情功能，做的也是比較成熟了，這裡要謝謝白玉樑同學，下面我帶領大家來一起學習一下他的

ORACLE中的自定義聚合函式（User-Defined Aggregate Functions）

聚合函式也叫分組函式，是對多行進行計算的一種函式，比如SUM、COUNT、AVG、MAX、MIN等等。Oracle中為了增強擴充套件性，提供了一個自定義聚合函式的介面，ODCIAggregate()，使用者可以用Oracle支援的各類程式語言（PLSQL、C、C++、JAVA

C# WinForm中如何自定義config檔案（XML檔案），並且讀取和儲存它

我這裡以連結資料庫為例子，其中書寫的Config的xml檔案如下： <?xml version="1.0" encoding="utf-8"?> <configuration> <appSettings> <add k

DispNet中Caffe自定義層解讀（二）——DataAugmentation

DispNet中Caffe自定義層解讀（二）——DataAugmentation

文章目錄

詳細功能介紹

用法

功能

呼叫方式

呼叫方式1：層中定義擴張引數

呼叫方式2：通過其他資料擴張層提供引數

data_augmentation_layer.hpp

data_augmentation_layer.cpp

LayerSetUp

Reshape

data_augmentation_layer.cu

Forward_gpu

相關推薦