【Network Architecture】Densely Connected Convolutional Networks 論文解析

阿新 • • 發佈：2018-10-30

正則作者 knowledge math cit png 包括 col 整體

0. Paper link

1. Overview

技術分享圖片

??文章開篇提到了如果在靠近輸入與輸出的層之間存在短連接（shorter connections），可以訓練更深、更準確、更有效的卷積網絡，DenseNet利用了這個性質，每層都與之前所有的層進行連接，即之前所有層的feature map都作為這一層的輸入。DenseNet有減少梯度消失，增強特征傳遞，鼓勵特征重利用同時極大的減少了參數的數量。在很多任務上達到了state-of-the-art.
??另外DenseNet並不是像ResNet那樣在傳入下一層之前把特征進行相加，如同GoogLeNet一樣他把feature進行融合，因此\(l^{th}\)

有\(l\)個輸入包括前面所有的卷積塊(convolutional blocks), 另外雖然叫DenseNet，但是他比傳統的卷及網絡需要更少的參數，因為他沒有必要重新學習多余的特征圖（stochastic ResNet證明ResNet其實有很多沒有用的層數），DenseNet層很窄（例如每一層有12個濾波器），僅僅增加小數量的特征圖到網絡的“集體知識”（collective knowledge），並且保持這些特征圖不變——最後的分類器基於網絡中的所有特征圖進行預測。
??除了具有更好的參數利用率，DenseNets還有一個優點是它改善了網絡中信息和梯度的傳遞，這就讓網絡更容易訓練。每一層都可以直接利用損失函數的梯度以及最開始的輸入信息，相當於是一種隱形的深度監督（implicit deep supervision）。這有助於訓練更深的網絡。此外，作者還發現稠密連接有正則化的作用，在更少訓練集的任務中可以降低過擬合。
??文章構建了如圖上圖的“dense block”每一個block內部feature size是相同的，在中間的transition layer進行feature size的改變與傳遞。同時還設置了growth rate來調節網絡的size。

??感覺DenseNet充分的利用了feature之間的fusing，其實在看完ResNet的時候，我就這種想法，為什麽ResNet大多數shortcut只是跨過2-3層呢，作者提到實驗這些效果最好，他實驗的range是多少呢？為什麽不能多跨過幾個，讓模型fuse的更多呢，當時覺得硬性規定shortcut的範圍並不是很好，感覺至少要學習一個參數去學習具體應該多少，每一層都去學習一個參數或許更好。而DenseNet則直接把所有的feature融合在一起，達到了一個所有feature作為一個“大feature”，結合GoogLeNet的一些思想，這個模型的提出並不難理解的，難得往往是第一個提出來的思想，比如AlexNet，現在也忘不了第一次見到ResNet的興奮感與新奇感，也讓我愛上了算法，找到了當初ACM的感覺（廢話說多了）。

2. DenseNet Architecture

??設\(H_{l}(·)\)為一個非線性轉化（transformation）,\(H_{l}(·)\)可以是BN層，ReLU,poolinghuozhe Conv的一個組合function，設一共有\(L\)層，\(l^{th}\)層的輸出為\(x_{l}\)

2.1 Analogy to ResNet

??ResNet的形式如下：
\[ X_{l} = H_{l}(X_{l-1}) + X_{l-1} \]
很顯然他是把\(l-1\)層的輸出與殘差映射的值相加起來，作者提到這可能影響到信息在網絡中的流動。
??DenseNet的形式如下：
\[ X_l = H_l([X_0, X_1, .....X_{l-1}]) \]
即\(l\)層的輸入是0到\(l-1\)層的輸出串聯起來，實際操作中會把前\(l-1\)層的輸入放進一個單獨的張量中(tensor)

2.2 Composite function

??在DenseNet中，定義\(H_{l}(·)\)為一個BN層後面接著ReLU層和一個3 × 3卷積的復合型函數

2.3 Dense block and Transition layer

??很容易發現如果某一層的前\(l-1\)層的向量size不同，就無法拼接起來，因此受GoogLeNet的啟發，把densely connected的部分組成一個dense block，在兩個dense block中間引入transition layer，用來卷積與池化。在文章實驗中transition layer包括一個BN層和1 × 1卷積層在緊接著一個2×2 average pooling layer。

2.4 Growth rate

??如果\(H_l\)產生\(k\)個feature maps，那麽\(l^{th}\)有 \(k_0 + k×(l-1)\)層input feature maps，其中\(k_0\)是輸入層的channels，DenseNet的一個很好的優點就是DenseNet可以變得很窄，比如\(k = 12\)，把\(k\)作為一個超參數，叫做\(growth\ rate\)，文章實驗證明了很小的\(k\)也可以獲得很多state-of-the-art的結果。
??作者把這一部分進行了解析，每一層都接收之前所有層的feature，相當於獲得了“集體知識(collective knowledge)”，作者提出把feature maps看做一個網絡的總體階段（global state），每一層貢獻自己k個feature maps給這個階段，growth rate決定了每層貢獻多少新的信息給global state。

2.5 Bottleneck layers

??盡管每層只產生k個feature maps，但是把之前所有層都加起來還是很多的，因此引入一個1 × 1的\(bottleneck layers\)在每個3 × 3卷積之前來減少輸入的feature maps，文章中給出了非常適合DenseNet的bottleneck layer： BN-ReLU-Conv(1 × 1)-BN-ReLU-Conv(3 × 3)，把這種形式的\(H_l\)表示為DenseNet-B，在實驗中，讓每個1 × 1 卷積產生4k個feature maps。

2.6 Compression

??如果一個dense block 包含m個feature maps，讓緊接著的transition layer 產生\([\theta m]\)個 output feature-maps，其中\(0< \theta \leq 1\)代表壓縮因子（compression factor），把\(\theta < 1\)的DenseNet看作DenseNet-C，把同時帶有bottleneck layer與compression factor < 1的DenseNet稱為DenseNet-BC.

2.7 Global Network Architecture

??一個整體的結構圖：

技術分享圖片

??網絡參數：（註意Conv代表BN-ReLU-Conv）

技術分享圖片

3. Experiments

??DenseNet在CIFAR與SVHN數據集上與各種主流網絡的參數與錯誤率對比：

技術分享圖片

??DenseNet在ImageNet 驗證集上1-crop / 10-crop對比：

技術分享圖片

??DenseNet在ImageNet 驗證集上與ResNet控制變量對比：

技術分享圖片

??DenseNet在C10+ 驗證集上與ResNet控制變量對比：
技術分享圖片

4. Discussion

??隱含的深度監督（implicit deep supervision）。稠密卷積網絡可以提升準確率的一個解釋是，由於更短的連接，每一層都可以從損失函數中獲得監督信息。可以將DenseNets理解為一種“深度監督”（deep supervision）。深度監督的好處已經在之前的深度監督網絡（DSN）中說明，該網絡在每一隱含層都加了分類器，迫使中間層也學習判斷特征（discriminative features）。

??DensNets和深度監督網絡相似：網絡最後的分類器通過最多兩個或三個過渡層為所有層都提供監督信息。然而，DenseNets的損失函數值和梯度不是很復雜，這是因為所有層之間共享了損失函數。

??遵循這個簡單的連接規則，DenseNets可以很自然的將自身映射（identity mappings）、深度監督（deep supervision）和深度多樣化（diversified depth）結合在一起。

【Network Architecture】Densely Connected Convolutional Networks 論文解析

正則作者 knowledge math cit png 包括 col 整體 0. Paper link 1. Overview ??文章開篇提到了如果在靠近輸入與輸出的層之間存在短連接（shorter connections），可以訓練更深、更準確、更有效的卷積網絡，D

【論文學習】Densely Connected Convolutional Networks 學習

眾所周知，自從ResNet 的網路結構被提出後，一直引領著深度學習的潮流，後來提出的一些網路結構都有這種short paths 的思想。而今天要提到的DenseNet 更是將這種思想發揮到了極致。DenseNet 憑藉著優秀的表現當選 CVPR 2017

Densely Connected Convolutional Networks 論文筆記

0 摘要最近的成果顯示，如果神經網路各層到輸入和輸出層採用更短的連線，那麼網路可以設計的更深、更準確且訓練起來更有效率。本文根據這個現象，提出了Dense Convolutional Network (DenseNet)，它以前饋的方式將每個層都連線

【Network Architecture】Feature Pyramid Networks for Object Detection(FPN)論文解析（轉）

目錄 0. 前言 1. 部落格一 2.。部落格二 0. 前言這篇論文提出了一種新的特徵融合方式來解決多尺度問題，感覺挺有創新性的，如果需要與其他網路進行拼接，還是需要再回到原文看一下細節。這裡轉了兩篇比較好的部落格作為備忘。 1. 部落格一這篇論文是CVPR20

【Network architecture】Rethinking the Inception Architecture for Computer Vision（inception-v3）論文解析

傳統 tps 聚合更遠瓶頸 orm -o 分類每一個 0. paper link inception-v3 1. Overview ??這篇文章很多“經驗”性的東西，因此會寫的比較細，把文章裏的一些話摘取出來，多學習一下，希望對以後自己設計網絡有幫助。 2. Four

【Semantic Segmentation】 Instance-sensitive Fully Convolutional Networks論文解析

ict rain 反向傳播 line sem segment 獲取工作 xtra 這篇文章比較簡單，但還是不想寫overview，轉自： https://blog.csdn.net/zimenglan_sysu/article/details/52451098 另外，讀這

【Network Architecture】Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning（轉） Feature Extractor[Inception v4]

文章來源： https://www.cnblogs.com/shouhuxianjian/p/7786760.html Feature Extractor[Inception v4] 0. 背景隨著何凱明等人提出的ResNet v1，google這邊坐

【Network Architecture】Densely Connected Convolutional Networks 論文解析

0. Paper link

1. Overview

2. DenseNet Architecture

2.1 Analogy to ResNet

2.2 Composite function

2.3 Dense block and Transition layer

2.4 Growth rate

2.5 Bottleneck layers

2.6 Compression

2.7 Global Network Architecture

3. Experiments

4. Discussion

【Network Architecture】Densely Connected Convolutional Networks 論文解析

【論文學習】Densely Connected Convolutional Networks 學習

Densely Connected Convolutional Networks 論文筆記

【Network Architecture】Feature Pyramid Networks for Object Detection(FPN)論文解析（轉）

【Network architecture】Rethinking the Inception Architecture for Computer Vision（inception-v3）論文解析

【Semantic Segmentation】 Instance-sensitive Fully Convolutional Networks論文解析

【Network Architecture】Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning（轉） Feature Extractor[Inception v4]

【Network Architecture】SegNet論文解析（轉）

Densely Connected Convolutional Networks (DenseNet 2017 CVPR)

Deep Learning 33：讀論文“Densely Connected Convolutional Networks”-------DenseNet 簡單理解

論文DenseNet（Densely Connected Convolutional Networks）解讀

論文筆記：Densely Connected Convolutional Networks(DenseNet模型詳解)

Densely Connected Convolutional Networks(DenseNet)

深度學習論文翻譯解析（十五）：Densely Connected Convolutional Networks

【CV論文閱讀】Two stream convolutional Networks for action recognition in Vedios

【論文筆記】Region-based Convolutional Networks for Accurate Object Detection and Segmentation

【深度網路】Non-local Neural Networks

【Network telemetry】談談網路遙感技術，從主動探測與被動探測再到Netflow與INT

【學習筆記】關於DOM4J：使用DOM4J解析XML文檔

【SpringMVC架構】SpringMVC入門實例，解析工作原理（二）

【Network Architecture】Densely Connected Convolutional Networks 論文解析

0. Paper link

1. Overview

2. DenseNet Architecture

2.1 Analogy to ResNet

2.2 Composite function

2.3 Dense block and Transition layer

2.4 Growth rate

2.5 Bottleneck layers

2.6 Compression

2.7 Global Network Architecture

3. Experiments

4. Discussion

相關推薦