『計算機視覺』輕量化網路之MobileNet_v1

阿新 • • 發佈：2019-01-07

論文原址：MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

Mobilenet v1是Google於2017年釋出的網路架構，旨在充分利用移動裝置和嵌入式應用的有限的資源，有效地最大化模型的準確性，以滿足有限資源下的各種應用案例。Mobilenet v1也可以像其他流行模型（如VGG，ResNet）一樣用於分類、檢測、嵌入和分割等任務提取影象卷積特徵。

一、Mobilenet v1 對卷積網路的拆分

Mobilenet v1核心是把卷積拆分為Depthwise+Pointwise兩部分。

普通卷積層

假設有 $N\times H\times W \times C$ 的輸入，同時有 $k$ 個 $3\times3$ 的卷積。如果設定 $pad=1$ 且 $stride=1$ ，那麼普通卷積輸出為 $N\times H\times W \times k$ 。

Depthwise卷積

Depthwise是指將 $N\times H\times W \times C$ 的輸入分為 $group=C$ 組，然後每一組做 $3\times3$ 卷積。這樣相當於收集了每個Channel的空間特徵，即Depthwise特徵。

Pointwise卷積

Pointwise是指對 $N\times H\times W \times C$ 的輸入做 $k$ 個普通的 $1\times1$ 卷積。這樣相當於收集了每個點的特徵，即Pointwise特徵。Depthwise+Pointwise最終輸出也是 $N\times H\times W \times k$ 。

Depthwise+Pointwise

Depthwise+Pointwise可以近似看作一個卷積層：

普通卷積：

3x3 Conv+BN+ReLU
Mobilenet卷積：3x3 Depthwise Conv+BN+ReLU 和 1x1 Pointwise Conv+BN+ReLU

對比一下不同卷積的乘法次數：

普通卷積計算量為： $H\times W \times C\times k \times 3\times 3$
Depthwise計算量為： $H\times W \times C \times 3\times 3$
Pointwise計算量為： $H\times W\times C\times k$

通過Depthwise+Pointwise的拆分，相當於將普通卷積的計算量壓縮為：

$\frac{depthwise+pointwise}{conv}=\frac{H\times W \times C \times 3\times 3 + H\times W\times C\times k}{H\times W \times C\times k \times 3\times 3}=\frac{1}{k} +\frac{1}{3\times 3}$

二、Mobilenet v1基本架構

還可以對所有卷積層 $kernel$ 數量統一乘以縮小因子 $\alpha$ （其中 $\alpha\in(0,1]，典型值為1，0.75，0.5和0.25$ ）以壓縮網路。這樣Depthwise+Pointwise總計算量可以進一降低為：

$H\times W \times \alpha C \times 3\times 3 + H\times W\times \alpha C\times \alpha k$

當然，壓縮網路計算量肯定是有代價的。下圖展示了 $\alpha$ 不同時Mobilenet v1在ImageNet上的效能。可以看到即使 $\alpha=0.5$ 時Mobilenet v1在ImageNet上依然有63.7%的準確度。

下圖展示Mobilenet v1 $\alpha=1.0$ 與GoogleNet和VGG16的在輸入解析度 $224\times 224$ 情況下，準確度差距非常小，但是計算量和引數量都小很多。同時原文也給出了以Mobilenet v1提取特徵的SSD/Faster R-CNN在COCO資料集上的效能。

『計算機視覺』輕量化網路之MobileNet_v1

一、Mobilenet v1 對卷積網路的拆分

普通卷積層

Depthwise卷積

Pointwise卷積

Depthwise+Pointwise

二、Mobilenet v1基本架構

『計算機視覺』輕量化網路之MobileNet_v1

『計算機視覺』Mask-RCNN_訓練網路其三：model準備

『計算機視覺』物體檢測之RefineDet

『計算機視覺』SSD源碼學習_基於TensorFlow（待續）

『計算機視覺』Normalization層（待續）

『計算機視覺』RCNN學習_其二：Mask-RCNN

『計算機視覺』mini深度學習框架實現

『計算機視覺』Mask-RCNN_訓練網絡其三：model準備

『計算機視覺』Mask-RCNN_從服裝關鍵點檢測看KeyPoints分支（待續）

『計算機視覺』YOLO系列總結

『轉_計算機視覺』深度學習中的數據增強

『中級篇』數據持久化之Data Volume（34）

『中級篇』數據持久化之bind Mounting（35）

斯坦福cs231n計算機視覺——卷積神經網路初步

輕量化網路：MobileNet-V2

【計算機視覺】【神經網路與深度學習】YOLO v2 detection訓練自己的資料

輕量化網路：SqueezeNet

【計算機視覺】相機姿態估計之標記檢測-ArUco鑽石標記的檢測4

輕量化網路：ShuffleNet V2

計算機視覺（二）-opencv之createTrackbar()詳解

『計算機視覺』輕量化網路之MobileNet_v1

一、Mobilenet v1 對卷積網路的拆分

普通卷積層

Depthwise卷積

Pointwise卷積

Depthwise+Pointwise

二、Mobilenet v1基本架構

相關推薦