論文記錄_MobileNets Efficient Convolutional Neural Networks for Mobile Vision Application

阿新 • • 發佈：2019-01-15

depthwise separable convolution
2.1 標準卷積
標準的卷積層是將維度為DF×DF×MDF×DF×M的輸入層轉化為維度為DG×DG×NDG×DG×N [ 上篇論文中也有提到]
DFDF 是輸入feature map的長和寬，M 是輸入的通道數（channels）
DGDG 是輸出feature map的長和寬，N 是輸出的通道數
假設卷積核filter的大小是Dk×DkDk×Dk，則標準卷積的計算量是
Dk⋅Dk⋅M⋅N⋅DF⋅DF
Dk⋅Dk⋅M⋅N⋅DF⋅DF

引用上篇論文中的圖, 只看kernel matrix 部分，Dk⋅DkDk⋅Dk就是一個方格的大小，然後乘上輸入和輸出的channels個數，然後作用在input feature maps

kernel matrix

標準卷積是這樣的, 即不管當前pixel有多少channels，卷積之後就是一個channel

regular conv
2.2 Depthwise Separable Convolution
分為兩個步驟
第一步深度卷積：卷積核的大小是Dk×Dk×1×MDk×Dk×1×M，所以總的計算量是：
Dk⋅Dk⋅M⋅DF⋅DF
Dk⋅Dk⋅M⋅DF⋅DF
第二步逐點卷積：卷積核大小是1×1×M×N1×1×M×N，所以總的計算量是：
M⋅N⋅DF⋅DF
M⋅N⋅DF⋅DF
所以和標準的卷積相比計算量比率為：
Dk⋅Dk⋅M⋅DF⋅DF+M⋅N⋅DF⋅DFDk⋅Dk⋅M⋅N⋅DF⋅DF=1N+1D2k
Dk⋅Dk⋅M⋅DF⋅DF+M⋅N⋅DF⋅DFDk⋅Dk⋅M⋅N⋅DF⋅DF=1N+1Dk2

MobileNet使用的是3x3的卷積核，所以計算量可以減少8-9倍 (因為比率是1/N+1/9)
第一步深度卷積操作是在每一個channel上進行的卷積操作

- 第二步逐點卷積才是結合起來

3. 神經網路結構
MobileNet共有28層（深度卷積和逐點卷積分開來算）
之前標準的結構是卷積層之後跟上Batch Normalization層和Relu啟用函式，這裡引入Depthwise separable convolution之後的結構如下圖
每一層都跟上了BN層和啟用函式
總的結構

4. 寬度乘數（Width Multiplier）
引入超引數αα, 目的是使模型變瘦,
即輸入層的channels個數M，變成αMαM，輸出層的channels個數N變成了αNαN
所以引入寬度乘數後的總的計算量是
Dk⋅Dk⋅αM⋅DF⋅DF+αM⋅αN⋅DF⋅DF
Dk⋅Dk⋅αM⋅DF⋅DF+αM⋅αN⋅DF⋅DF

一般α∈(0,1]α∈(0,1]，常取的值是1, 0.75, 0.5, 0.25,
大約可以減少引數量和計算量的α2α2
5. 解析度乘數（Resolution Multiplier）
引入超引數ρρ，目的是降低圖片的解析度
即作用在輸入的feature map上
所以再引入解析度乘數後總的計算量是：
Dk⋅Dk⋅αM⋅ρDF⋅ρDF+αM⋅αN⋅ρDF⋅ρDF
Dk⋅Dk⋅αM⋅ρDF⋅ρDF+αM⋅αN⋅ρDF⋅ρDF

一般輸入圖片的解析度是224, 192, 160 or 128
大約可以減少計算量的ρ2ρ2
6. 實驗結果
關於超引數的選擇，下圖可以看出準確度和引數量和引數運算量的關係，之間有個trade off，合理選擇引數即可

還在細粒度的識別，大規模地理位置識別，人臉屬性提取，目標檢測和人臉識別等任務上進行了測試，效果也很好
7. 總結
主要是基於depthwise separable convolution
引入了兩個超引數
[ 第一個寬度乘數就是減少feature map，以此來降低模型厚度 ]
[ 第二個解析度乘數就是縮小feature map的大小，來減少計算量]
[ 超引數的選擇是有個trade off的 ]
Reference
https://arxiv.org/abs/1704.04861
https://github.com/tensorflow/models/blob/master/slim/nets/mobilenet_v1.md
https://github.com/shicai/MobileNet-Caffe
http://machinethink.net/blog/googles-mobile-net-architecture-on-iphone/
---------------------
作者：莫失莫忘Lawlite
來源：CSDN
原文：https://blog.csdn.net/u013082989/article/details/77970196
版權宣告：本文為博主原創文章，轉載請附上博文連結！

論文記錄_MobileNets Efficient Convolutional Neural Networks for Mobile Vision Application

論文記錄_MobileNets Efficient Convolutional Neural Networks for Mobile Vision Application

深度學習論文翻譯解析（六）：MobileNets：Efficient Convolutional Neural Networks for Mobile Vision Appliications

深度學習論文翻譯解析（十七）：MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

論文筆記之Learning Convolutional Neural Networks for Graphs

【論文閱讀筆記】-《Quantized Convolutional Neural Networks for Mobile Devices》

《Convolutional Neural Networks for Sentence Classification》論文結構解讀

【論文閱讀】Learning Dual Convolutional Neural Networks for Low-Level Vision

Highly Efficient Forward and Backward Propagation of Convolutional Neural Networks for Pixelwise Cla

Understanding Convolutional Neural Networks for NLP

A Sensitivity Analysis of Convolutional Neural Networks for Sentence Classification

Building Fast and Compact Convolutional Neural Networks for Offline HCCR

Stanford University CS231n: Convolutional Neural Networks for Visual Recognition

Convolutional Neural Networks for Beginners: Practical Guide with Python and Keras

[CVPR2015] Is object localization for free? – Weakly-supervised learning with convolutional neural networks論文筆記

EffNet: An Efficient Structure for Convolutional Neural Networks

論文閱讀-(CVPR 2017) Kernel Pooling for Convolutional Neural Networks

【論文閱讀】Bag of Tricks for Image Classification with Convolutional Neural Networks

論文筆記：Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks

影象隱寫術分析論文筆記：Deep learning for steganalysis via convolutional neural networks

論文記錄_MobileNets Efficient Convolutional Neural Networks for Mobile Vision Application

相關推薦