Pytorch中的Batch Normalization操作

阿新 • • 發佈：2018-07-19

from 小數 http 結果 data 特定 -c 作用 run

之前一直和小夥伴探討batch normalization層的實現機理，作用在這裏不談，知乎上有一篇paper在講這個，鏈接

這裏只探究其具體運算過程，我們假設在網絡中間經過某些卷積操作之後的輸出的feature map的尺寸為4×3×2×2

4為batch的大小，3為channel的數目，2×2為feature map的長寬

整個BN層的運算過程如下圖

技術分享圖片

上圖中，batch size一共是4, 對於每一個batch的feature map的size是3×2×2

對於所有batch中的同一個channel的元素進行求均值與方差，比如上圖，對於所有的batch，都拿出來最後一個channel，一共有4×4=16個元素，

然後求區這16個元素的均值與方差（上圖只求了mean，沒有求方差。。。），

求取完了均值與方差之後，對於這16個元素中的每個元素進行減去求取得到的均值與方差，然後乘以gamma加上beta，公式如下

技術分享圖片

所以對於一個batch normalization層而言，求取的均值與方差是對於所有batch中的同一個channel進行求取，batch normalization中的batch體現在這個地方

batch normalization層能夠學習到的參數，對於一個特定的channel而言實際上是兩個參數，gamma與beta，對於total的channel而言實際上是channel數目的兩倍。

用pytorch驗證上述想法是否準確，用上述方法求取均值，以及用batch normalization層輸出的均值，看看是否一樣

上代碼

 1 # -*-coding:utf-8-*-
 2 from torch import nn
 3 import torch
 4 
 5 m = nn.BatchNorm2d(3)  # bn設置的參數實際上是channel的參數
 6 input = torch.randn(4, 3, 2, 2)
 7 output = m(input)
 8 # print(output)
 9 a = (input[0, 0, :, :]+input[1, 0, :, :]+input[2, 0, :, :]+input[3, 0, :, :]).sum()/16
10 
 b = (input[0, 1, :, :]+input[1, 1, :, :]+input[2, 1, :, :]+input[3, 1, :, :]).sum()/16
11 c = (input[0, 2, :, :]+input[1, 2, :, :]+input[2, 2, :, :]+input[3, 2, :, :]).sum()/16
12 print(‘The mean value of the first channel is %f‘ % a.data)
13 print(‘The mean value of the first channel is %f‘ % b.data)
14 print(‘The mean value of the first channel is %f‘ % c.data)
15 print(‘The output mean value of the BN layer is %f, %f, %f‘ % (m.running_mean.data[0],m.running_mean.data[0],m.running_mean.data[0]))
16 print(m)

用

m = nn.BatchNorm2d(3)

聲明新的batch normalization層，用

input = torch.randn(4, 3, 2, 2)

模擬feature map的尺寸

輸出值

技術分享圖片

咦，怎麽不一樣，貌似差了一個小數點，可能與BN層的momentum變量有關系，在生命batch normalization層的時候將momentum設置為1試一試

m.momentum=1

輸出結果

技術分享圖片

沒毛病

至於方差以及輸出值，大抵也是這樣進行計算的吧，留個坑

Pytorch中的Batch Normalization操作

from 小數 http 結果 data 特定 -c 作用 run 之前一直和小夥伴探討batch normalization層的實現機理，作用在這裏不談，知乎上有一篇paper在講這個，鏈接這裏只探究其具體運算過程，我們假設在網絡中間經過某些卷積操作之後的輸出的fea

pytorch中batch normalisation的注意事項

torch中的各種批歸一的注意事項，不間斷更新20180402 含有batchnorm的網路其train和eval時效果差距大和是否zero_grad及其位置關係不大，因為這個錯了，trai

tensorflow中Batch Normalization的實現

tensorflow版本1.4 tensorflow目前還沒實現完全封裝好的Batch Normalization的實現，這裡主要試著實現一下。關於理論可參見《解讀Batch Normalization》對於TensorFlow下的BN的實現，首先我

Batch normalization及其在tensorflow中的實現

Batch normalization(BN) BN是對輸入的特徵圖進行標準化的操作，其公式為： xx - 原輸入 x^x^ - 標準化後的輸入 μμ - 一個batch中的均值 σ2σ2 - 一個batch中的方差 ϵϵ - 一個很小的

pytorch中的上取樣以及各種反操作，求逆操作

import torch.nn.functional as F import torch.nn as nn F.upsample(input, size=None, scale_factor=None,mode='nearest', align

CNN 中的BN（batch normalization）“批歸一化”原理

在看 ladder network(https://arxiv.org/pdf/1507.02672v2.pdf) 時初次遇到batch normalization（BN）. 文中說BN能加速收斂等好處，但是並不理解，然後就在網上搜了些關於BN的資料。

pytorch中對影象的基本操作

Pytorch提供了一個torchvision.transforms的包，可以使用transforms進行如下操作： 1、ＰＩＬ.image / numpy. ndarray 與Ｔｅｎｓｏｒ相互轉化２、進行歸一化３、對PIL.image進行裁剪、縮放等操作一、ＰＩＬ.ima

深度學習中的Batch Normalization

在看 ladder network(https://arxiv.org/pdf/1507.02672v2.pdf) 時初次遇到batch normalization（BN）. 文中說BN能加速收斂等好處，但是並不理解，然後就在網上搜了些關於BN的資料。看了知

TensorFlow 中的正則化（Batch Normalization）詳解和實現程式碼

雖然在訓練初期使用 He 初始化方法初始ELU（或者其他派生的ReLU）能夠有效的防止梯度彌散、爆炸問題。但是這種方式無法保證梯度問題不會在訓練過程中產生。 2015年的一篇paper（ “Batch Normalization: Accel

PyTorch筆記9-Batch Normalization

概要我們知道 normalize input（歸一化輸入）可以加速神經網路的訓練，那我們是否可以 normalize activation function 並 speed up 網路訓練呢，這就是 Batch Normalization（B

pytorch中的L2和L1正則化，自定義優化器設定等操作

在pytorch中進行L2正則化，最直接的方式可以直接用優化器自帶的weight_decay選項指定權值衰減率，相當於L2正則化中的λλ，也就是： Lreg=||y−y^||2+λ||W||2(1)(

Batch Normalization的概述和應用包括在CNN和RNN中的應用

Batch Normalization 學習筆記一、背景意義本篇博文主要講解2015年深度學習領域，非常值得學習的一篇文獻：《Batch Normalization: Accelerating Deep

從頭學pytorch(十九):批量歸一化batch normalization

批量歸一化論文地址:https://arxiv.org/abs/1502.03167 批量歸一化基本上是現在模型的標配了. 說實在的,到今天我也沒搞明白batch normalize能夠使得模型訓練更穩定的底層原因,要徹底搞清楚,涉及到很多凸優化的理論,需要非常紮實的數學基礎才行. 目前為止,我理解的批量歸

【Oracle】Oracle中的常用操作

轉換成 sql查詢語句 sub 備份關系 %d des 統計分析 put 一、ORACLE的啟動和關閉 1、在單機環境下要想啟動或關閉ORACLE系統必須首先切換到ORACLE用戶，如下 su - oracle a、啟動ORACLE系統 oracle>svrmgr

數據框中的基本操作

sta http mage wan img 一行 ati 技術 cnblogs 1.加列名 2.subset某一列 subset函數的應用：http://blog.163.com/jiaqiang_wang/blog/static/1188961532015830018

JQuery中的Dom操作和事件

表單 lba app 選擇 ava return server pen log （一）JQuery中的事件 1.常規事件，把js事件中的on去掉　　復合事件：hover(function(){},function(){}) ---- 相當於把鼠標移入移出事件和在一起執行

每天一個JS 小demo之個人信息添加。主要知識點：DOM操作中的表格操作，節點操作

mov src i++ blog this tex set elements img 以下是簡易效果： <!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8">

Batch normalization:accelerating deep network training by reducing internal covariate shift的筆記

work second mean 其它什麽區域引用 right delta 說實話，這篇paper看了很久，，到現在對裏面的一些東西還不是很好的理解。下面是我的理解，當同行看到的話，留言交流交流啊！！！！！這篇文章的中心點：圍繞著如何降低 internal

tesnorflow Batch Normalization

graph point ilo eps net store scope psi bat 1.train或者從checkpoint restore後發現moving_mean和moving_variance都是0和1 bn1_mean = graph.get_tensor_

第三章（jQuery中的DOM操作）

var taf document 單元素節點根據 .cn 2.4 input 3.1 DOM 操作分類 ①DOM Core 包括（getElementById() , getElementsByTagName() , getAttribute() , setAtt

Pytorch中的Batch Normalization操作

相關推薦