Network In Network——卷積神經網絡的革新

阿新 • • 發佈：2017-06-10

gin src center log 感知 eat line pro bsp

Network In Network 是13年的一篇paper

引用：Lin M, Chen Q, Yan S. Network in network[J]. arXiv preprint arXiv:1312.4400, 2013.

文章的新點：

1. 采用 mlpcon 的結構來代替 traditional 卷積層；

2. remove 卷積神經網絡最後的全連接層，采用 global average pooling 層代替；

mplconv 結構的提出：

conventional 的卷積層可以認為是linear model , 為什麽呢，因為局部接收域上的每每一個tile 與卷積核進行加權求和，然後接一個激活函數；它的 abstraction 的能力不夠，對處理線性可分的的 concept 也許是可以的，但是更復雜的 concepts 它有能力有點不夠了，所以呢，需要引入 more potent 的非線性函數；

基於此，提出了 mlpcon 結構，它用多層的感知器（其實就是多層的全連接層）來替代單純的卷積神經網絡中的加權求和； mlpcon 指的是： multilayer perceptron + convolution;

兩者的結構如下所示：其中下圖的 Mlpconv 的有兩層的隱含層；

說明：在mlpconv中的每一層的後面都跟著一個 ReLU激活函數；用於加入更多的nonlinearity;

global average pooling 結構：

卷積神經網絡最後的全連接層可以說作為了一個分類器，或者作為了一個 feature clustering. 它把卷積層學習到的特征進行最後的分類； intuitively, 根本不了解它是怎麽工作的，它就像一個黑盒子一樣，並且它也引入了很多的參數，會出現 overfitting 現象；（我認為其實最後的全接層就是一個分類器）

本文，remove掉了全連接層，使用 global average pooling 來代替；舉個例子更容易說明白：假設分類的任務有100 classes，所以設置網絡的最後的 feature maps 的個數為 100，把每一個feature map 看作成對應每一類的概率的相關值，然後對每一個 feature map 求平均值（即 global average pooling), 得到了 100維的向量，把它直接給 softmax層，進行分類；（其實100個數中最大值對應的類別即為預測值，之所以再送給 softmax層是為了求 loss，用於訓練時求梯度）

網絡的整體結構：

（原 paper 中的圖）

（該圖來自：http://blog.csdn.net/hjimce/article/details/50458190 ，加入了相關的參數。我怎麽找到這個圖呢？？？？難道樓主自己根據 caffe 中的 .prototxt 文件的加上的？？）

mlpconv 的細節：

輸入為一個feature map, 輸出為一個feature map 時：

輸入為多個feature map, 輸出為一個feature map 時：

輸入為多個feature map, 輸出為多個feature map 時：

發現了什麽？

在卷積神經網絡中，無論是輸入還是輸出，不同的 feature map 之間的卷積核是不相同的；

在mlpconv中，不同的 feature map 之間的開頭與能結尾之間的權值不一樣，而在隱含層之間的權值是共享的；

另外：

全連接層之間可以看作一特殊的卷積層，其中卷積核的大小為 1*1， feature maps的個數即為全連接層中的每一層的units的數目；

所以呢，假設上面的第三個圖中的輸入為2*（4 *4），輸出為2 * （3*3）時：

第一層的卷積核大小為2*2，步長為1，輸入為2*（4 *4），輸出為 4*（3*3）；

第二層的卷積核大小為1*1，步長為1，輸入為4*（3 *3），輸出為 3*（3*3）；

第三層的卷積核大小為1*1，步長為1，輸入為3*（3 *3），輸出為 2*（3*3）；

global average pooling 的細節：

當分類的類別有4種時，則最後的 global average pooling 應該是這樣的：

NIN結構的caffe實現：

因為我們可以把全連接層當作為特殊的卷積層，所以呢， NIN在caffe中是非常容易實現的：

https://github.com/BVLC/caffe/wiki/Model-Zoo#network-in-network-model

這是由BVLC（Berkeley Vision Learning Center）維護的一個caffe的各種model及訓練好的參數權值，可以直接下載下來用的；

其它：

文中的觀點：通過實驗說明了 global average pooling 也可以起到很好的 regular的作用。

另外，一個比較有趣地地方就是：在可視化最後一層 feature maps時，它的激活區域與原始圖片中目標所在的區域竟然相似；amazing!

補充：

文中大量用到了文獻：Maxout networks. (引用：Goodfellow I J, Warde-Farley D, Mirza M, et al. Maxout networks[J]. arXiv preprint arXiv:1302.4389, 2013.）

文中也說明了 NIN比 maxout networks 更 non-linearity;

後續很有必要看一下文獻 maxout networks 這個paper，它具有很好的價值；

參考文獻：Lin M, Chen Q, Yan S. Network in network[J]. arXiv preprint arXiv:1312.4400, 2013.

Network In Network——卷積神經網絡的革新

gin src center log 感知 eat line pro bsp Network In Network 是13年的一篇paper 引用：Lin M, Chen Q, Yan S. Network in network[J]. arXiv preprint ar

【翻譯】TensorFlow卷積神經網絡識別CIFAR 10Convolutional Neural Network (CNN)| CIFAR 10 TensorFlow

man 加載 published class cif alt lis update air 原網址:https://data-flair.training/blogs/cnn-tensorflow-cifar-10/ by DataFlair Team · Publish

Stanford CS231n實踐筆記（課時22卷積神經網絡工程實踐技巧與註意點 cnn in practise 上）

self ash 2gb ble 一個 time 縮放對比度 cati 本課主要2個實踐內容：1、keras中數據集豐富，從數據集中提取更多特征（Data augmentation）2、遷移學習（Tranform learning）代碼：https://github.co

[透析] 卷積神經網絡CNN究竟是怎樣一步一步工作的？（轉）

caff 素數 aec near chris line 旋轉均值水平視頻地址：https://www.youtube.com/embed/FmpDIaiMIeA 轉載：http://www.jianshu.com/p/fe428f0b32c1 文檔參閱：pdf

AI相關 TensorFlow -卷積神經網絡踩坑日記之一

一個模糊結果隊列二維圖片路徑降維支持日記上次寫完粗淺的BP算法介紹本來應該繼續把卷積神經網絡算法寫一下的但是最近一直在踩 TensorFlow的坑。所以就先跳過算法介紹直接來應用場景，原諒我吧。 TensorFlow 介紹 TF是google

『cs231n』卷積神經網絡的可視化與進一步理解

都是 lan 精度輸出上采樣一行 ear 模型運算 cs231n的第18課理解起來很吃力，聽後又查了一些資料才算是勉強弄懂，所以這裏貼一篇博文（根據自己理解有所修改）和原論文的翻譯加深加深理解。可視化理解卷積神經網絡原文地址一、相關理論本篇博文主要講解201

C++卷積神經網絡實例：tiny_cnn代碼具體解釋（6）——average_pooling_layer層結構類分析

加權 for com 整數 ret 子類 mismatch normal 信息　　在之前的博文中我們著重分析了convolutional_layer類的代碼結構。在這篇博文中分析相應的下採樣層average_pooling_layer類：　　一、下採樣層的作用　　下採

卷積神經網絡（CNN）

進行參數一個目的下一步方便 logs 很多好的最近可能會用到CNN，今天回顧一下，並找到了一些大神的精華帖，順便做個總結。 CNN是時下非常火的一種深度學習算法，它是一種前饋神經網絡，即神經元只與前後層有聯系，在同一層的神經元無聯系。筆者用下面這張圖用來說明卷

TensorFlow框架(4)之CNN卷積神經網絡詳解

this map ets 多層神經網絡本地 height its 網絡操作 1. 卷積神經網絡 1.1 多層前饋神經網絡　　多層前饋神經網絡是指在多層的神經網絡中，每層神經元與下一層神經元完全互連，神經元之間不存在同層連接，也不存在跨層連接的情況，如圖 11所示。

Tensorflow框架初嘗試————搭建卷積神經網絡做MNIST問題

過擬合 dict cast 官方文檔 float hot blog next 神經網絡 Tensorflow是一個非常好用的deep learning框架學完了cs231n，大概就可以寫一個CNN做一下MNIST了 tensorflow具體原理可以參見它的官方文檔然後C

卷積神經網絡--CNN

圖像信息 log 處理 hub input hidden 激勵 3.2 1.人工神經網絡神經網絡由大量的節點（或稱“神經元”、“單元”）和相互連接而成。每個神經元接受輸入的線性組合，進行非線性變換（亦稱激活函數activation function）後輸出。每兩

卷積神經網絡(CNN)模型結構

數學 deep 2個領域全連接平均值 over amp title 卷積神經網絡(CNN)模型結構轉載：http://www.cnblogs.com/pinard/p/6483207.html 看到的一片不錯的文章，先轉過來留著，怕以後博

卷積神經網絡中的參數計算

http cnblogs 大學卷積神經網絡 nbsp images 技術分享 logs 裏的舉例1：　　比如輸入是一個32x32x3的圖像，3表示RGB三通道，每個filter/kernel是5x5x3，一個卷積核產生一個feature map，下圖中，有6個5x5x

基於深度學習的病毒檢測技術無需沙箱環境，直接將樣本文件轉換為二維圖片，進而應用改造後的卷積神經網絡 Inception V4 進行訓練和檢測

進制思科開發主題需求做的病毒無法大於話題 3: 基於深度學習的二進制惡意樣本檢測分享主題：全球正在經歷一場由科技驅動的數字化轉型，傳統技術已經不能適應病毒數量飛速增長的發展態勢。而基於沙箱的檢測方案無法滿足 APT 攻擊的檢測需求，也受到多種反沙箱技術的

學習筆記TF057:TensorFlow MNIST，卷積神經網絡、循環神經網絡、無監督學習

back ide str 描述 com 類別 bat softmax 比例 MNIST 卷積神經網絡。https://github.com/nlintz/TensorFlow-Tutorials/blob/master/05_convolutional_net.py 。Te

Tensorflow卷積神經網絡[轉]

entropy sam 人的 cast 2.6 關於 == element 兩個 Tensorflow卷積神經網絡卷積神經網絡(Convolutional Neural Network, CNN)是一種前饋神經網絡, 在計算機視覺等領域被廣泛應用. 本文將簡單介紹其原

吳恩達 DeepLearning.ai 課程提煉筆記（4-2）卷積神經網絡 --- 深度卷積模型

mes and shift abd actual 應用比賽特征通道 1. 經典的卷積網絡介紹幾種經典的卷積神經網絡結構，分別是LeNet、AlexNet、VGGNet。 LeNet-5： LeNet-5主要是針對灰度設計的，所以其輸入較小，為，其結構如下：

『TensorFlow』讀書筆記_簡單卷積神經網絡

ssi init 計算全連接 min clas labels bat hold 網絡結構卷積層->池化層->卷積層->池化層->全連接層->Softmax分類器卷積層激活函數使用relu 全連接層激活函數使用relu 池化層模式使用SAM

典型卷積神經網絡架構

5.0 深度學習文獻 www cep 分享並且 mage vol 參考資料 0 Figures First 1 LeNet5 貢獻 2 Dan Ciresan Net 3 AlexNet 貢獻 4 VGG19 貢獻 5 Network-in

TensorFlow 卷積神經網絡--卷積層

意圖有著 image 卷積神經網絡細節 inf gpo body kernel 之前我們已經有一個卷積神經網絡識別手寫數字的代碼，執行下來正確率可以達到96%以上。若是再優化下結構，正確率還可以進一步提升1~2個百分點。卷積神經網絡在機器學習領域有著廣泛的應用。現在

Network In Network——卷積神經網絡的革新

文章的新點：

mplconv 結構的提出：

global average pooling 結構：

網絡的整體結構：

mlpconv 的細節：

global average pooling 的細節：

NIN結構的caffe實現：

其它：

補充：

相關推薦