深度學習雜記（3）resnet殘差塊

阿新 • • 發佈：2019-01-24

深度學習的resnet的原理比較容易懂，但是具體的程式碼構建還是有些複雜，尤其是在tensorflow 的框架下構建比較複雜，在今天的博文中主要介紹了殘差單元的構建：

import collections
import tensorflow as tf
import tensorflow.contrib.slim as slim
def subsample(inputs,factor,scope=None):
    if(factor==1):
        return inputs
    else:
        return slim.max_pool2d(inputs,[1,1],stride=factor,scope=scope)

上述這段程式碼的目的是為了構建一個降取樣的函式，目的是為了使輸入通道相同的preact的shape經過池化，shape達到一樣

def conv2d_same(inputs, num_outputs, kernel_size, stride, scope=None):
    if(stride==1):
        return slim.conv2d(inputs,num_outputs,kernel_size,stride=1,padding='SAME',scope=scope)
    else:
        net = slim.conv2d(inputs, num_outputs, 3, stride=1, padding='SAME')
        net = subsample(net, factor=stride)
        return net;

若stride==1，則對其做一個卷積取值，相當於全連線神經網路的作用，否則則是對其進行3*3卷積之後採取降取樣使得shortcut和residual的shape保持一致

def bottleneck(inputs, depth, depth_bottleneck, stride,
               outputs_collections=None, scope=None):
    """
    Args:
      inputs: A tensor of size [batch, height, width, channels].
      depth、depth_bottleneck:、stride三個引數是前面blocks類中的args
      rate: An integer, rate for atrous convolution.
      outputs_collections: 是收集end_points的collection
    """
    with tf.variable_scope(scope, 'bottleneck_v2', ) as sc:
        depth_in = slim.utils.last_dimension(inputs.get_shape(), min_rank=4)  # 最後一個維度,即輸出通道數
        preact = slim.batch_norm(inputs, activation_fn=tf.nn.relu, scope='preact')

        if depth == depth_in:
            # 如果殘差單元的輸入通道數和輸出通道數一致，那麼按步長對inputs進行降取樣
            shortcut = subsample(inputs, stride, 'shortcut')
        else:
            # 如果不一樣就按步長和1*1的卷積改變其通道數，使得輸入、輸出通道數一致
            shortcut = slim.conv2d(preact, depth, [1, 1], stride=stride,
                                   normalizer_fn=None, activation_fn=None,
                                   scope='shortcut')

        # 先是一個1*1尺寸，步長1，輸出通道數為depth_bottleneck的卷積
        residual = slim.conv2d(preact, depth_bottleneck, [1, 1], stride=1, scope='conv1')
        # 然後是3*3尺寸，步長為stride，輸出通道數為depth_bottleneck的卷積
        residual = conv2d_same(residual, depth_bottleneck, 3, stride, scope='conv2')
        # 最後是1*1卷積，步長1，輸出通道數depth的卷積，得到最終的residual。最後一層沒有正則項也沒有啟用函式
        residual = slim.conv2d(residual, depth, [1, 1], stride=1,
                               normalizer_fn=None, activation_fn=None,
                               scope='conv3')

        # 將降取樣的結果和residual相加
        output = shortcut + residual

        return slim.utils.collect_named_outputs(outputs_collections, sc.name, output)

最後是整個殘差塊的設計。

深度學習雜記（3）resnet殘差塊

深度學習的resnet的原理比較容易懂，但是具體的程式碼構建還是有些複雜，尤其是在tensorflow 的框架下構建比較複雜，在今天的博文中主要介紹了殘差單元的構建： import collections import tensorflow as tf import ten

吳恩達深度學習筆記（八） —— ResNets殘差網絡

con 一個學習 ets str 帶來圖片梯度就是（好累……，明日在寫……）主要內容：一.殘差網絡簡介二.identity block 和 convolutional block 一.殘差網絡簡介 1.深度神經網絡很大的一個優點就是能夠表示一個

（轉載）深度學習基礎（3）——神經網路和反向傳播演算法

原文地址：https://www.zybuluo.com/hanbingtao/note/476663 轉載在此的目的是自己做個筆記，日後好複習，如侵權請聯絡我！！　　在上一篇文章中，我們已經掌握了機器學習的基本套路，對模型、目標函式、優化演算法這些概念有了一定程度的理解，而且已經會訓練單個的感知器或者

吳恩達深度學習筆記（3）-神經網路如何實現監督學習？

神經網路的監督學習(Supervised Learning with Neural Networks) 關於神經網路也有很多的種類，考慮到它們的使用效果，有些使用起來恰到好處，但事實表明，到目前幾乎所有由神經網路創造的經濟價值，本質上都離不開一種叫做監督學習的機器學習類別，讓我們舉例看看。

深度學習實戰（3）-打造自己的影象識別模型

這個筆記弄的我難受，推薦觀看者還是看原書吧............ 用VGG16作為例子簡單介紹：如何使用，去掉尾部，保留引數初始值如何訓練資料準備檔案轉換 data_convert.py原始碼： # coding:utf-8 fr

深度學習筆記（3）——CNN中一些特殊環節的反向傳播

但是傳統的神經網路無論是隱層還是啟用函式的導數都是可導，可以直接計算出導數函式，然而在CNN網路中存在一些不可導的特殊環節，比如Relu等不可導的啟用函式、造成維數變化的池化取樣、已經引數共享的卷積環節。NN網路的反向傳播本質就是梯度（可能學術中會用殘差這個

深度學習系列（3）——使用神經網路去辨識手寫數字

1、人腦的數字辨識人腦的視覺系統可以說是世界的奇蹟之一，看下面一行數字：你會覺得你毫不費力地看出了它是 50419 ，其實識別的過程並不簡單。人類大腦的每個半球中，有一個初級視覺皮層，V1

C++深度解析教程學習筆記（3）函數的擴展

插入分享技術 lsp 預處理器 _for 返回忽略結合 1.內聯函數 1.1.常量與宏的回顧 (1)C++中的 const 常量可以替代宏常數定義,如: const int A = 3; //等價於 #define A 3 (2)C++中是否有解決方案,可以用來

開始寫博客，學習Linq（3）

frame 一般來說開發人員 framework 編程語言開發語言工具語句並且為什麽需要Linq?（摘自原文）讀者會發現LINQ著眼於解決編程語言和數據庫之間廣發存在的不統一問題。 1.常見的問題，使用.NET Framework Class Library(

bfzwjeqjSpriNgMc學習系列（3）之url

ref htm 學習 pri blank url lan get 系列 bfzwjeqjSpriNgMc學習系列（3）之url χ絳 bfzwjeqjSpriNgMc學習系列（3）之urlbfzwjeqjSpriNgMc學習系列（3）之url

TCP/IP詳解學習筆記（3）IP協議ARP協議和RARP協議

out 處理機傳輸包含發送 res 這也進行默認把這三個協議放到一起學習是因為這三個協議處於同一層，ARP協議用來找到目標主機的Ethernet網卡Mac地址，IP則承載要發送的消息。數據鏈路層可以從ARP得到數據的傳送信息，而從IP得到要傳輸的數據信息。　　

spring學習筆記（3）——bean配置細節註意

collect 1.5 之前 ice ble person name return 引用 1. 一個bean引用另外一個bean 當Person類中有一個屬性是Car，那麽該如何配置呢 person： package com.zj.spring; public class

QT學習筆記（3）我的第一個程序

9.png har 中文 gets 有一個 setw 通過坐標關系今天，學習搭建一個空項目，了解程序是如何運行的。（1）新建一個空項目　　1、在創建完空項目之後，項目中只有一個空的項目文件（ .pro）　　　　　　2、然後需要在項目文件（.pro）中添加：

深度學習筆記（九）感受野計算

lds 時有輸入計算 ret name %d have imsi 1 感受野的概念　　在卷積神經網絡中，感受野的定義是卷積神經網絡每一層輸出的特征圖（feature map）上的像素點在原始圖像上映射的區域大小。一般感受野大小是目標大小的兩倍左右最合適！　　　　

Hibernate學習筆記（3）---hibernate關聯關系映射

gen -m type foreign out eas ner 機制路徑一對一關聯假設有兩個持久化類（實體類）User與Address，它們之間存在一對一的關系 1，通過主鍵關聯（個人偏向另外一種） User.hbm.xml文件配置 <id name="u

《神經網絡與深度學習》（三）稀疏編碼

學習方法深度學習變體復雜鏈接線性規劃 con images 叠代轉自：http://www.cnblogs.com/caocan702/p/5666175.html 借鑒前人的文章鏈接 http://blog.csdn.net/zouxy09/article

[egret+pomelo]實時遊戲雜記（3）

登錄地址 ram tor 需求 app cts 分配 ges [egret+pomelo]學習筆記（1） [egret+pomelo]學習筆記（2） [egret+pomelo]學習筆記（3）服務端的請求流程走完了一遍，下面就該看一下，在目前的服務端中，各服務端所提

shell學習筆記（3）

shell 基礎雜記if 一、if基礎 1、單分支 1.1 語法 if語句語法單分支結構語法： if [條件]; then 指令 fi 或 if [條件] then 指令 fi 1.2 例子 [roo

你應該這個姿勢學習php（3）

php1、ob_start() 開啟文件緩存 2、ob_get_contents() 得到緩存中的內存 3、ob_get_length() 得到緩沖區的長度 4、ob_flush() 輸出緩沖區的內容，如果你想獲取緩沖區的內容要在這個函數之前使用ob_get_contents()，不然數據將會被清空 5、ob

Python學習筆記（3）

python重要的數據類型Dict和Setdict通過key 查找value（key和value關聯）花括號{ }表示這是一個dict，然後按照key:value，寫出來即可。最後一個key:value的都好可以省略註意: 單元素的tuple必須在後面多家加一個逗號dict最後的逗號可以省略由於dict也是

深度學習雜記（3）resnet殘差塊

相關推薦