《2017-Aggregated Residual Transformations for Deep Neural Networks》論文閱讀

阿新 • • 發佈：2018-11-24

如何評價谷歌的xception網路？

動機

傳統的要提高模型的準確率，都是加深或加寬網路，但是隨著超引數數量的增加（比如channels數，filter size等等），網路設計的難度和計算開銷也會增加。
本文提出的 ResNeXt 結構可以在不增加引數複雜度的前提下提高準確率，同時還減少了超引數的數量；

貢獻

作者在這篇論文中提出網路 ResNeXt，同時採用 VGG 堆疊的思想和 Inception 的 split-transform-merge 思想，但是可擴充套件性比較強，可以認為是在增加準確率的同時基本不改變或降低模型的複雜度。這裡提到一個名詞cardinality，原文的解釋是the size of the set of transformations，如下圖 Fig1 右邊是 cardinality=32 的樣子，這裡注意每個被聚合的拓撲結構都是一樣的(這也是和 Inception 的差別，減輕設計負擔)

附上原文比較核心的一句話，點明瞭增加 cardinality 比增加深度和寬度更有效，這句話的實驗結果在後面有展示：

網路結構

Table1 列舉了 ResNet-50 和 ResNeXt-50 的內部結構，另外最後兩行說明二者之間的引數複雜度差別不大。

接下來作者要開始講本文提出的新的 block，舉全連線層（Inner product）的例子來講，我們知道全連線層的就是以下這個公式：

再配上這個圖就更容易理解其splitting，transforming和aggregating的過程。

然後作者的網路其實就是將其中的 wixi替換成更一般的函式，這裡用了一個很形象的詞：Network in Neuron，式子如下：（其中C就是 cardinality，Ti有相同的拓撲結構（本文中就是三個卷積層的堆疊）。）

然後看看fig 3。這裡作者展示了三種相同的 ResNeXt blocks。fig3.a 就是前面所說的aggregated residual transformations。 fig3.b 則採用兩層卷積後 concatenate，再卷積，有點類似 Inception-ResNet，只不過這裡的 paths 都是相同的拓撲結構。fig 3.c採用的是grouped convolutions，這個 group 引數就是 caffe 的 convolusion 層的 group 引數，用來限制本層卷積核和輸入 channels 的卷積，最早應該是 AlexNet 上使用，可以減少計算量。這裡 fig 3.c 採用32個 group，每個 group 的輸入輸出 channels 都是4，最後把channels合併。這張圖的 fig3.c 和 fig1 的左邊圖很像，差別在於fig3.c的中間 filter 數量（此處為128，而fig 1中為64）更多。作者在文中明確說明這三種結構是嚴格等價的，並且用這三個結構做出來的結果一模一樣，在本文中展示的是 fig3.c 的結果，因為 fig3.c 的結構比較簡潔而且速度更快。

《2017-Aggregated Residual Transformations for Deep Neural Networks》論文閱讀

如何評價谷歌的xception網路？動機傳統的要提高模型的準確率，都是加深或加寬網路，但是隨著超引數數量的增加（比如channels數，filter size等等），網路設計的難度和計算開銷也會增加。本文提出的 ResNeXt 結構可以在不增加引數複

【論文閱讀】Aggregated Residual Transformations for Deep Neural Networks Saining（ResNext）

這篇文章是kaiming大神的組的工作，在resnet上繼續改進。一作謝賽寧，2013年從上海交大本科畢業後去UCSD讀博士，現在他引1400+了（不知道我畢業時能不能有這個的一半QAQ），導師是Zhuowen Tu。 Introduction 現代的網路設計中通常會次堆疊

On Loss Functions for Deep Neural Networks in Classification讀後感

分類問題中的另一類loss函式 In particular, for purely accuracy focused research, squared hinge loss seems to be a better choice at it converge

DeepPose: Human Pose Estimation via Deep Neural Networks論文翻譯

翻譯點選連結獲取基本思想級聯網路架構：在第一階段將影象輸入後得到大致位置，在之後的階段利用相同的網路架構得到更精細的結果。對級聯的所有階段使用相同的網路架構，但學習不同的網路引數。其中網路架構使用的是Alex，所不同的是loss函式，AlexNet是用於分類的，而本文的架構是用於迴

Sequence to Sequence Learning with Neural Networks論文閱讀

[論文下載](https://papers.nips.cc/paper/5346-sequence-to-sequence-learning-with-neural-networks.pdf) ![](https://s2.ax1x.com/2020/03/05/3TxBrt.png#shadow) 作者

DeepEyes: 用於深度神經網絡設計的遞進式可視分析系統 (DeepEyes: Progressive Visual Analytics for Designing Deep Neural Networks)

失誤 min 使用包括系統所有訓練如果 blog 深度神經網絡，在模式識別問題上，取得非常不錯的效果。但設計一個性能好的神經網絡，需要反復嘗試，是個非常耗時的過程。這個工作[1]實現了用於深度神經網絡設計的可視分析系統，DeepEyes。該系統可以在DNNs訓練過

YouTube推薦系統（下）：Deep Neural Networks for YouTube Recommendations

咳，還是要說說這篇文章，雖然講它的人已經很多了。畢竟作為深度學習模型大規模應用於工業界推薦系統的標誌，這篇文章是繞不過去的。原文來自Deep Neural Networks for YouTube Recommendations，是YouTube2016年發表於Recosys的文章。這篇文章的結構依然很經

Deep Neural Networks for Object Detection

zhuanzii 採用的是AlexNet,不過稍作修改。原AlexNet網路：具體改進： 1. 把最後一個層softmax改成a regession layer. predict a mask of a fixed size. 1代表this pixel l

Channel Pruning for Accelerating Very Deep Neural Networks

https://github.com/yihui-he/channel-pruning ICCV 2017, by Yihui He, Xiangyu Zhang and Jian Sun Please have a look at&

論文閱讀筆記二十九：One pixel attack for fooling deep neural networks（CVPR2017）

論文源址：https://arxiv.org/abs/1710.08864 tensorflow程式碼: https://github.com/Hyperparticle/one-pixel-attack-keras 摘要

機器學習筆記~Practical Advice for Building Deep Neural Networks by Matt H and Daniel R

這是一篇從外文網站轉載的一篇關於構建深度神經網路時的建議，在進行網路搭建時可以適當借鑑和參考。 Practical Advice for Building Deep Neural Networks In our machine learning lab, we’ve

論文閱讀-(CVPR 2017) Kernel Pooling for Convolutional Neural Networks

在這篇論文中，作者提出了一種更加通用的池化框架，以核函式的形式捕捉特徵之間的高階資訊。同時也證明了使用無引數化的緊緻清晰特徵對映，以指定階形式逼近核函式，例如高斯核函式。本文提出的核函式池化可以和CNN網路聯合優化。 Network Structure Overview Kernel Pooling

Deep Neural Networks for Regression Problems

First : Processing the datasetWe will not go deep in processing the dataset, all we want to do is getting the dataset ready to be fed into our models .We w

【深度學習論文筆記】Deep Neural Networks for Object Detection

論文:<<Deep Neural Networks for Object Detection>> 作者:Christian Szegedy Al

論文筆記：Deep neural networks for YouTube recommendations

https://blog.csdn.net/xiongjiezk/article/details/73445835 Download [1] Covington P, Adams J, Sargin E. Deep neural networks for youtube recommen

Cheat Sheets for AI, Neural Networks, Machine Learning, Deep Learning & Big Data

在過去的幾個月中，我一直在收集有關人工智慧的相關資料。隨著各種的問題被越來越頻繁的提及，我決定整理並分享有關人工智慧、神經網路、機器學習、深度學習與大資料的技術合輯。同時為了內容更加生動易懂，本文將會針對各個大類展開詳細解析。神經網路機器學習機器學習： Scikit-l

學習摘要：Methods for interpreting and understanding deep neural networks

原文： Methods for interpreting and understanding deep neural networks 部落格內容：關於該文章的學習摘要將論文的關鍵內容進行了翻譯、配圖說明，配合原文閱讀，應該能較好的理解文章內涵 PS：

Channel Pruning for Accelerating Very Deep Neural Networks 演算法筆記

這是一篇ICCV2017的文章，關於用通道剪枝（channel pruning）來做模型加速，通道減枝是模型壓縮和加速領域的一個重要分支。文章的核心內容是對訓練好的模型進行通道剪枝（channel pruning），而通道減枝是通過迭代兩步操作進行的：第

MLHPC 2018 | Aluminum: An Asynchronous, GPU-Aware Communication Library Optimized for Large-Scale Training of Deep Neural Networks on HPC Systems

這篇文章主要介紹了一個名為Aluminum通訊庫，在這個庫中主要針對Allreduce做了一些關於計算通訊重疊以及針對延遲的優化，以加速分散式深度學習訓練過程。 ### 分散式訓練的通訊需求 #### 通訊何時發生一般來說，神經網路的訓練過程分為三步：前向傳播、反向傳播以及引數優化。在使用資料並行進行分散

Mastering the game of Go with deep neural networks and tree search

深度策略參數初始化技術以及 -1 簡單 cpu 網絡 Silver, David, et al. "Mastering the game of Go with deep neural networks and tree search." Nature 529.758

《2017-Aggregated Residual Transformations for Deep Neural Networks》論文閱讀

動機

貢獻

網路結構

相關推薦