1. 程式人生 > >RFBNet目標檢測演算法詳細總結分析(one/two-stage)(深度學習)(ECCV 2018)

RFBNet目標檢測演算法詳細總結分析(one/two-stage)(深度學習)(ECCV 2018)

論文名稱:《 Receptive Field Block Net for Accurate and Fast Object Detection 》

論文下載:https://arxiv.org/pdf/1711.07767.pdf

論文程式碼:https://github.com/ruinmessi/RFBNet


RFB-Net: RFB-Net在inception的基礎上加入了dilated卷積層,增大了感受野,增強網路特徵提取能力。

dilated conv不是在畫素之間padding空白的畫素,而是在已有的畫素上,skip掉一些畫素,或者輸入不變,對conv的kernel引數中插一些0的weight,達到一次卷積看到的空間範圍變大的目的。當然將普通的卷積stride步長設為大於1,也會達到增加感受野的效果,但是stride大於1就會導致down-sampling,影象尺寸變小。

RFB是一個類似Inception模組的多分支卷積模組,它的內部結構可分為兩個元件:具有不同卷積核的多分支卷積層以及隨後的膨脹卷積層。微調RFB引數主要就是調節RFB模組中卷積核kernel size以及膨脹因子rate(核心元素間的距離)。

在每個分支上,特定核大小的卷積層後面跟著一個相應膨脹係數的卷積層,最後,所有分支的feature map被連線起來,合成一個空間池化或卷積陣列。(b)中,用兩個3*3的卷積層代替5*5的卷積層來減少引數並深化非線性層,用一個1*n和一個n*1的卷積層來替換原始的n*n卷積層。

RFB-Net檢測器利用多尺度一步檢測框架SSD,在其中嵌入RFB模組,模擬人類感受野進行RFB的設計,使得輕量級主幹SSD網路也能更快更準。相對較大解析度的feature map的前卷積層被RFB模組取代。

RFB-Net檢測結構: