深度學習卷積神經網路——經典網路GoogLeNet(Inception V3)網路的搭建與實現

阿新 • • 發佈：2019-01-16

一、Inception網路（google公司）——GoogLeNet網路的綜述

獲得高質量模型最保險的做法就是增加模型的深度（層數）或者是其寬度（層核或者神經元數），

但是這裡一般設計思路的情況下會出現如下的缺陷：

1.引數太多，若訓練資料集有限，容易過擬合；

2.網路越大計算複雜度越大，難以應用；

3.網路越深，梯度越往後穿越容易消失，難以優化模型。

解決上述兩個缺點的根本方法是將全連線甚至一般的卷積都轉化為稀疏連線。為了打破網路對稱性和提高

學習能力，傳統的網路都使用了隨機稀疏連線。但是，計算機軟硬體對非均勻稀疏資料的計算效率很差，

所以在AlexNet中又重新啟用了全連線層，目的是為了更好地優化並行運算。

現在的問題是有沒有一種方法，

既能保持網路結構的稀疏性，又能利用密集矩陣的高計算效能。

二、 Inception模組介紹

Inception架構的主要思想是找出如何用密整合分來近似最優的區域性稀疏結。

對上圖做以下說明：

1 . 採用不同大小的卷積核意味著不同大小的感受野，最後拼接意味著不同尺度特徵的融合；

2 . 之所以卷積核大小採用1*1、3*3和5*5，主要是為了方便對齊。設定卷積步長stride=1之後，

只要分別設定padding =0、1、2，採用same卷積可以得到相同維度的特徵，然後這些特徵直接拼接在一起；

3 . 文章說很多地方都表明pooling挺有效，所以I

nception裡面也嵌入了pooling。

4 . 網路越到後面特徵越抽象，且每個特徵涉及的感受野也更大，隨著層數的增加，3x3和5x5卷積的比例也要增加。

Inception的作用：代替人工確定卷積層中的過濾器型別或者確定是否需要建立卷積層和池化層，即：不需要人為的

決定使用哪個過濾器，是否需要池化層等，由網路自行決定這些引數，可以給網路新增所有可能值，將輸出連線

起來，網路自己學習它需要什麼樣的引數。

naive版本的Inception網路的缺陷：計算成本。使用5x5的卷積核仍然會帶來巨大的計算量，約需要1.2億次的計算量。

為減少計算成本，採用1x1卷積核來進行降維

。示意圖如下：

在3x3和5x5的過濾器前面，max pooling後分別加上了1x1的卷積核，最後將它們全部以通道/厚度為軸拼接起來，

最終輸出大小為28*28*256，卷積的引數數量比原來減少了4倍，得到最終版本的Inception模組：

三、googLeNet介紹

1、googLeNet——Inception V1結構

googlenet的主要思想就是圍繞這兩個思路去做的：

（1）.深度，層數更深，文章採用了22層，為了避免上述提到的梯度消失問題，

googlenet巧妙的在不同深度處增加了兩個loss來保證梯度回傳消失的現象。

（2）.寬度，增加了多種核 1x1，3x3，5x5，還有直接max pooling的，

但是如果簡單的將這些應用到feature map上的話，concat起來的feature map厚度將會很大，

所以在googlenet中為了避免這一現象提出的inception具有如下結構，在3x3前，5x5前，

max pooling後分別加上了1x1的卷積核起到了降低feature map厚度的作用。

對上圖做如下說明：（1）顯然GoogLeNet採用了Inception模組化（9個）的結構，共22層，方便增添和修改；（2）網路最後採用了average pooling來代替全連線層，想法來自NIN,引數量僅為AlexNet的1/12,效能優於AlexNet，事實證明可以將TOP1 accuracy提高0.6%。但是，實際在最後還是加了一個全連線層，主要是為了方便finetune；（3）雖然移除了全連線，但是網路中依然使用了Dropout ; （4）為了避免梯度消失，網路額外增加了2個輔助的softmax用於向前傳導梯度。文章中說這兩個輔助的分類器的loss應該加一個衰減係數，但看caffe中的model也沒有加任何衰減。此外，實際測試的時候，這兩個額外的softmax會被去掉。

（5）上述的GoogLeNet的版本成它使用的Inception V1結構。

2、Inception V2結構

大尺寸的卷積核可以帶來更大的感受野，也意味著更多的引數，比如5x5卷積核引數是3x3卷積核的25/9=2.78倍。

為此，作者提出可以用2個連續的3x3卷積層(stride=1)組成的小網路來代替單個的5x5卷積層，這便是Inception V2結構，

保持感受野範圍的同時又減少了引數量，如下圖：

3、Inception V3結構

大卷積核完全可以由一系列的3x3卷積核來替代，那能不能分解的更小一點呢。

文章考慮了nx1 卷積核，如下圖所示的取代3x3卷積：

於是，任意nxn的卷積都可以通過1xn卷積後接nx1卷積來替代。實際上，作者發現在網路的前期使用這種分解效果

並不好，還有在中度大小的feature map上使用效果才會更好，對於mxm大小的feature map,建議m在12到20之間。

用nx1卷積來代替大卷積核，這裡設定n=7來應對17x17大小的feature map。該結構被正式用在GoogLeNet V2中。

4、Inception V4結構，它結合了殘差神經網路ResNet。

參考連結：http://blog.csdn.net/stdcoutzyx/article/details/51052847

http://blog.csdn.net/shuzfan/article/details/50738394#googlenet-inception-v2

5、Inception——ResNet V1 & Inception——ResNet V2

四、整體架構程式碼實現

GoogLeNet.py檔案實現Inception v3網路前向傳播過程以及網路的引數：

（一）slim應用介紹

slim這個模組是在16年新推出的，其主要目的是來做所謂的“程式碼瘦身”。

tensorflow官方對它的描述是：此目錄中的任何程式碼未經官方支援，可能會隨時更改或刪除。每個目錄下都有指定的所有者。它旨在包含額外功能和貢獻，最終會合併到核心TensorFlow中，但其介面可能仍然會發生變化，或者需要進行一些測試，看是否可以獲得更廣泛的接受。所以slim依然不屬於原生tensorflow。

slim是一個使構建，訓練，評估神經網路變得簡單的庫。它可以消除原生tensorflow裡面很多重複的模板性的程式碼，讓程式碼更緊湊，更具備可讀性。另外slim提供了很多計算機視覺方面的著名模型（VGG, AlexNet等），我們不僅可以直接使用，甚至能以各種方式進行擴充套件。

1、slim的匯入方法

2、slim子模組及功能介紹

（1）arg_scope：除了基本的namescope，variabelscope外，又加了arg_scope，它是用來控制每一層的預設超引數的。如果你的網路有大量相同的引數，如下所示：

net = slim.conv2d(inputs, 64, [11, 11], 4, padding='SAME',
                  weights_initializer=tf.truncated_normal_initializer(stddev=0.01),
                  weights_regularizer=slim.l2_regularizer(0.0005), scope='conv1')
net = slim.conv2d(net, 128, [11, 11], padding='VALID',
                  weights_initializer=tf.truncated_normal_initializer(stddev=0.01),
                  weights_regularizer=slim.l2_regularizer(0.0005), scope='conv2')
net = slim.conv2d(net, 256, [11, 11], padding='SAME',
                  weights_initializer=tf.truncated_normal_initializer(stddev=0.01),
                  weights_regularizer=slim.l2_regularizer(0.0005), scope='conv3')

用arg_scope處理一下：

with slim.arg_scope([slim.conv2d], padding='SAME',
                      weights_initializer=tf.truncated_normal_initializer(stddev=0.01)
                      weights_regularizer=slim.l2_regularizer(0.0005)):
    net = slim.conv2d(inputs, 64, [11, 11], scope='conv1')
    net = slim.conv2d(net, 128, [11, 11], padding='VALID', scope='conv2')
    net = slim.conv2d(net, 256, [11, 11], scope='conv3')

arg_scope作用範圍內：是定義了指定層的預設引數，若想特別指定某些層的引數，可以重新賦值（相當於重寫）

with slim.arg_scope([slim.conv2d, slim.fully_connected],
                      activation_fn=tf.nn.relu,
                      weights_initializer=tf.truncated_normal_initializer(stddev=0.01),
                      weights_regularizer=slim.l2_regularizer(0.0005)):
  with slim.arg_scope([slim.conv2d], stride=1, padding='SAME'):
    net = slim.conv2d(inputs, 64, [11, 11], 4, padding='VALID', scope='conv1')
    net = slim.conv2d(net, 256, [5, 5],
                      weights_initializer=tf.truncated_normal_initializer(stddev=0.03),
                      scope='conv2')
    net = slim.fully_connected(net, 1000, activation_fn=None, scope='fc')

（2）layers: 這個比較重要，slim的核心和精髓，一些複雜層的定義。

對比分別用tensorflow和slim實現一個卷積層的案例：

#tensorflow實現卷積層
with tf.name_scope('conv1_1') as scope:
  kernel = tf.Variable(tf.truncated_normal([3, 3, 64, 128], dtype=tf.float32,
                                           stddev=1e-1), name='weights')
  conv = tf.nn.conv2d(input, kernel, [1, 1, 1, 1], padding='SAME')
  biases = tf.Variable(tf.constant(0.0, shape=[128], dtype=tf.float32),
                       trainable=True, name='biases')
  bias = tf.nn.bias_add(conv, biases)
  conv1 = tf.nn.relu(bias, name=scope)

#slim實現卷積層
net = slim.conv2d(input, 128, [3, 3], scope='conv1_1')

比較吸引人的是slim中的repeat和stack操作，假設定義三個相同的卷積層，

在slim中的repeat操作可減少程式碼量：

net = slim.conv2d(net, 256, [3, 3], scope='conv3_1')
net = slim.conv2d(net, 256, [3, 3], scope='conv3_2')
net = slim.conv2d(net, 256, [3, 3], scope='conv3_3')
net = slim.max_pool2d(net, [2, 2], scope='pool2')

net = slim.repeat(net, 3, slim.conv2d, 256, [3, 3], scope='conv3')
net = slim.max_pool2d(net, [2, 2], scope='pool2')

stack是處理卷積核或者輸出不一樣的情況：假設定義三層FC：

# Verbose way:
x = slim.fully_connected(x, 32, scope='fc/fc_1')
x = slim.fully_connected(x, 64, scope='fc/fc_2')
x = slim.fully_connected(x, 128, scope='fc/fc_3')

使用stack操作：

slim.stack(x, slim.fully_connected, [32, 64, 128], scope='fc')

卷積層使用stack操作：

# 普通方法:
x = slim.conv2d(x, 32, [3, 3], scope='core/core_1')
x = slim.conv2d(x, 32, [1, 1], scope='core/core_2')
x = slim.conv2d(x, 64, [3, 3], scope='core/core_3')
x = slim.conv2d(x, 64, [1, 1], scope='core/core_4')
 
# 簡便方法:
slim.stack(x, slim.conv2d, [(32, [3, 3]), (32, [1, 1]), (64, [3, 3]), (64, [1, 1])], scope='core')

（3）nets: 包含一些經典網路，VGG等，用的也比較多.

（4）variables:這個比較有用，slim管理變數的機制.

變數分為兩類：模型變數和區域性變數。區域性變數是不作為模型引數儲存的，而模型變數會再save的時候儲存下來。諸如global_step之類的就是區域性變數。slim中可以寫明變數存放的裝置，正則和初始化規則。還有獲取變數的函式也需要注意一下，get_variables是返回所有的變數。

slim中定義一個變數的例項：

# Model Variables
weights = slim.model_variable('weights',
                              shape=[10, 10, 3 , 3],
                              initializer=tf.truncated_normal_initializer(stddev=0.1),
                              regularizer=slim.l2_regularizer(0.05),
                              device='/CPU:0')
model_variables = slim.get_model_variables()
 
# Regular variables
my_var = slim.variable('my_var',
                       shape=[20, 1],
                       initializer=tf.zeros_initializer())
regular_variables_and_model_variables = slim.get_variables()

（5）regularizers:包含一些正則規則.

（6）metrics:評估模型的度量標準.

（7）queues:文字佇列管理，比較有用。

（8）learning、losses

（二）inception_v3的網路結構

（三）inception_v3用slim實現的具體步驟及程式碼

1、定義函式 inception_v3_arg_scope 用來生成網路中經常用到的函式的預設引數

import tensorflow as tf
import tensorflow.contrib.slim as slim
#定義簡單的函式產生截斷的正態分佈
trunc_normal = lambda stddev:tf.truncated_normal_initializer(0.0,stddev)

#定義函式 inception_v3_arg_scope 用來生成網路中經常用到的函式的預設引數
def inception_v3_arg_scope(weight_decay=0.00004,stddev=0.1,
                           batch_norm_var_collection="moving_vars"):
    batch_norm_params = {
        "decay":0.9997,"epsilon":0.001,"updates_collections":tf.GraphKeys.UPDATE_OPS,
        "variables_collections":{
            "beta":None,"gamma":None,"moving_mean":[batch_norm_var_collection],
            "moving_variance":[batch_norm_var_collection]
        }
    }

    with slim.arg_scope([slim.conv2d,slim.fully_connected],
                        weights_regularizer=slim.l2_regularizer(weight_decay)):
        #對卷積層生成函式的幾個引數賦予預設值
        with slim.arg_scope([slim.conv2d],
                            weights_regularizer = tf.truncated_normal_initializer(stddev=stddev),
                            activation_fc = tf.nn.relu,
                            normalizer_fc = slim.batch_norm,
                            normalizer_params = batch_norm_params) as scope:
            return scope

2、定義Inception V3的卷積部分

#定義Inception V3的卷積部分
def inception_v3_base(inputs,scope=None):
    end_points = {}
    with tf.variable_scope(scope,"InceptionV3",[inputs]):
        with slim.arg_scope([slim.conv2d,slim.max_pool2d,slim.avg_pool2d],
                            stride = 1,padding = "VALID"):
            net = slim.conv2d(inputs,num_outputs=32,kernel_size=[3,3],stride=2,scope="Conv2d_1a_3x3")
            net = slim.conv2d(net,num_outputs=32,kernel_size=[3,3],scope="Conv2d_2a_3x3")
            net = slim.conv2d(net,num_outputs=64,kernel_size=[3,3],padding="SAME",scope="Conv2d_2b_3x3")
            net = slim.max_pool2d(net,kernel_size=[3,3],stride=2,scope="MaxPool_3a_3x3")
            net = slim.conv2d(net,num_outputs=80,kernel_size=[1,1],scope="Conv2d_3b_1x1")
            net = slim.conv2d(net,num_outputs=192,kernel_size=[3,3],scope="Conv2d_4a_3x3")
            net = slim.max_pool2d(net,kernel_size=[3,3],stride=2,scope="MaxPool_5a_3x3")

3.1、定義第一個Inception模組組

#定義第一個Inception模組組
    with slim.arg_scope([slim.conv2d,slim.max_pool2d,slim.avg_pool2d],
                        stride = 1,padding = "SAME"):
        with tf.variable_scope("Mixed_5b"):
            with tf.variable_scope("Branch_0"):
                batch_0 = slim.conv2d(net,num_outputs=64,kernel_size=[1,1],scope="Conv2d_0a_1x1")
            with tf.variable_scope("Branch_1"):
                batch_1 = slim.conv2d(net,num_outputs=48,kernel

 
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    深度學習卷積神經網路——經典網路GoogLeNet(Inception V3)網路的搭建與實現
      
                
一、Inception網路（google公司）——GoogLeNet網路的綜述
獲得高質量模型最保險的做法就是增加模型的深度（層數）或者是其寬度（層核或者神經元數），
但是這裡一般設計思路的情況下會出現如下的缺陷：
1.引數太多，若訓練資料集有限，容易過擬合；
2.網路越大 

  
 

    

    
    深度學習——卷積神經網路 的經典網路（LeNet-5、AlexNet、ZFNet、VGG-16、GoogLeNet、ResNet）
      
                一、CNN卷積神經網路的經典網路綜述二、LeNet-5網路輸入尺寸：32*32卷積層：2個降取樣層(池化層)：2個全連線層：2個輸出層：1個。10個類別（數字0-9的概率）   LeNet-5網路是針對灰度圖進行訓練的，輸入影象大小為32*32*1，不包含輸入層的情況下共有7 

  
 

    

    
    深度學習 --- 卷積神經網路CNN（LeNet-5網路學習演算法詳解）
       
 
 
 上一節我們詳細探討了LeNet-5網路的架構，但是還沒有解釋該網路是如何進行學習的，如何更新權值的，本節將接著上一節進一步CNN的學習機制和權值更新過程，這裡請大家一定要對CNN網路有一個清晰的認識，知道每一層是做什麼的，為什麼這樣設定。原因在哪等。大家在學習的過程中需要多問自己幾個為什麼，這樣 

  
 

    

    
    深度學習 --- 卷積神經網路CNN（LeNet-5網路詳解）
       
 
 
 卷積神經網路（Convolutional Neural Network，CNN）是一種前饋型的神經網路，其在大型影象處理方面有出色的表現，目前已經被大範圍使用到影象分類、定位等領域中。相比於其他神經網路結構，卷積神經網路需要的引數相對較少，使的其能夠廣泛應用。 
 本節打算先介紹背景和簡單的基本 

  
 

    

    
    吳恩達《深度學習-卷積神經網路》2--深度卷積神經網路
      
                1. Why look at case studies本節展示幾個神經網路的例項分析為什麼要講例項？近些年CNN的主要任務就是研究如何將基本構件（CONV、POOL、CF）組合起來形成有效的CNN，而學習瞭解前人的做法可以激發創造2. Classic Networks1）Le 

  
 

    

    
    深度學習--卷積神經網路工作原理
      
                
萬能的知乎

從知乎上看一篇文章，問題是卷積神經網路工作原理直觀的解釋，知乎大神用各種動圖對卷積神經網路的訓練做了介紹。YJango的回答最為精彩。奉上鍊接，希望你也能從這個回答中對卷積神經網路有更為確切的認識。https://www.zhihu.com/question/ 

  
 

    

    
    [人工智慧]深度學習卷積神經網路的秒懂各種操作
      
							
							
							作者:深度學習思考者



來給大家總結一下卷積神經網路的各種操作 ,大家能夠秒懂!

先來幾個靜態圖: 
 
 
 
卷積演算法的一些神奇GIF動畫，包括不同的padding和strides。 
 
 
 


上述是四種不同的卷積方式，大家都知道是哪種卷積吧 

  
 

    

    
    機器學習 -- >深度學習-- >卷積神經網路(CNN)
      
							
							
							上一篇我們詳細講解了人工神經網路以及DNN的原理。CNN主要應用在影象處理方面。這一講我們將詳細講解卷積神經網路CNN的原理以及在深度學習框架pytorch上的實現。

在講CNN之前我們需要了解這麼幾個問題？ 
①人工神經網路能用到計算機視覺上嗎？ 
答：能  

  
 

    

    
    深度學習卷積神經網路大事件一覽
      
                　　深度學習（DeepLearning）尤其是卷積神經網路（CNN）作為近幾年來模式識別中的研究重點，受到人們越來越多的關注，相關的參考文獻也是層出不窮，連續幾年都佔據了CVPR的半壁江山，但是萬變不離其宗，那些在深度學習發展過程中起到至關重要的推動作用的經典文獻依然值得回味 

  
 

    

    
    吳恩達-深度學習-卷積神經網路-Stride 筆記
      
                卷積中的步幅是另一個構建卷積神經網路的基本操作，讓我向你展示一個例子。如果你想用3×3的過濾器卷積這個7×7的影象，和之前不同的是，我們把步幅設定成了2。你還和之前一樣取左上方的3×3區域的元素的乘積，再加起來，最後結果為91。只是之前我們移動藍框的步長是1，現在移動的步長是 

  
 

    

    
    深度學習——卷積神經網路在tensorflow框架下的應用案例
      
                
一、簡單的卷積神經網路的小應用
tensorflow框架下構建訓練一個簡單的3層卷積神經網路實現分類問題
（一）資料集介紹——SIGNS Datasets


教電腦破譯手語，在白色的牆壁前拍照，得到以下資料集。

現在的任務是建立一個演算法，使有語音障礙的人與不懂手語的人 

  
 

    

    
    深度學習-卷積神經網路CNN-BN(Batch Normalization) 原理與使用過程詳解
      
                前言

Batch Normalization是由google提出的一種訓練優化方法。參考論文：Batch Normalization Accelerating Deep Network Training by Reducing Internal Covariate Shif 

  
 

    

    
    [深度學習]卷積神經網路：卷積、池化、常見分類網路
      
                卷積

全連線層：將卷積層所有的畫素展開，例如得到一個3072維的向量，然後在向量上進行操作。

卷積層：可以保全空間結構，不是展開成一個長的向量。

卷積操作：將卷積核從影象（或者上一層的feature map）的左上方的邊角處開始，遍歷卷積核覆蓋的所有畫素點。在每一個位置 

  
 

    

    
    Spark MLlib Deep Learning Convolution Neural Network (深度學習-卷積神經網路)3.3
      
                
3、Spark MLlib Deep Learning Convolution Neural Network(深度學習-卷積神經網路)3.3

第三章Convolution Neural Network (卷積神經網路)
3例項
3.1 測試資料
按照上例資料，或者新建圖片 

  
 

    

    
    吳恩達《深度學習-卷積神經網路》1--卷積神經網路
      
                1. Computer Vision計算機視覺包括：  --圖片分類（圖片識別）Image classification  --目標檢測 object detection  --神經風格遷移 neural style transfer，如合成圖片創造新的藝術風格計算機視覺面臨 

  
 

    

    
    深度學習:卷積神經網路基礎
      
                

卷積神經網路：卷積核

鏈式反向梯度傳導

傳導的過程就是導數係數傳導的過程。就是前一個導數的結果和當前求導的乘積



















卷積層：卷積神經的基本結構，由多個卷積核組成，每個卷積核同輸入資料卷積運算形成新的特徵圖。

這個就說這個卷積層(輸入 

  
 

    

    
    第五章（1.5）深度學習——卷積神經網路簡介
      
							
							
							卷積神經網路(Convolutional Neural Network, CNN)是一種前饋神經網路, 在計算機視覺等領域被廣泛應用. 本文將簡單介紹其原理並分析Tensorflow官方提供的示例.

一、工作原理

卷積是影象處理中一種基本方法. 卷積核是一個 

  
 

    

    
    深度學習-卷積神經網路-演算法比較
      # Convolutional Neural Networks(CNN)

## Abstract

隨著深度學習的發展，學術界造就了一個又一個優秀的神經網路，目前，最受歡迎的神經網路之一則是卷積神經網路，儘管有時它出現讓我們無法理解的黑盒子現象，但它依然是值得我們去探索的，**CNN**的設計也遵循了**活 

  
 

    

    
    深入學習卷積神經網路（CNN）的原理知識
      　　網上關於卷積神經網路的相關知識以及數不勝數，所以本文在學習了前人的部落格和知乎，在別人部落格的基礎上整理的知識點，便於自己理解，以後複習也可以常看看，但是如果侵犯到哪位大神的權利，請聯絡小編，謝謝。好了下面言歸正傳：
　　在深度學習領域中，已經經過驗證的成熟演算法，目前主要有深度卷積網路（DNN）和遞迴網 

  
 

    

    
    深度概覽卷積神經網路全景圖，沒有比這更全的了
      
                    

                    

                    
                    
                    來源： 人工智慧頭條  翻譯 | 林椿眄摘要：深度卷積神經網路是這一波 AI 浪潮背後的大功臣。