1. 程式人生 > >小目標檢測的一些理解

小目標檢測的一些理解

感受野

2017CVPR

github

乾貨:目標檢測

對抗網路

cvpr 程式碼

1.小目標檢測需要高解析度

可以提高輸入解析度

SSD對高解析度的底層特徵沒有再利用,但底層特徵的語義資訊少,這兩個互相矛盾。

另外SSD的anchors設計為0.1~0.2,最小的anchors大小為72,還是太大了。

2.feature map不能太小

卷積網路的最後一層的feature map不能太小。卷積網路越深,語義資訊越強,越底層是描述區域性外觀資訊越多。

3.可以多尺度檢測

4.多尺度特徵表示

解決小目標檢測問題的一般方法:提高輸入影象的解析度,會增加運算量;多尺度特徵表示,結果不可控

 

全卷積網路:

參考

FCN可以接受任意尺寸的輸入影象,與經典的CNN在卷積層之後使用全連線層得到固定長度的特徵向量進行分類(全聯接層+softmax輸出)不同。採用反捲積層對最後一個卷積層的feature map進行上取樣, 使它恢復到輸入影象相同的尺寸,從而可以對每個畫素都產生了一個預測, 同時保留了原始輸入影象中的空間資訊, 最後在上取樣的特徵圖上進行逐畫素分類。

CNN的強大之處在於它的多層結構能自動學習特徵,並且可以學習到多個層次的特徵:

較淺的卷積層感知域較小,學習到一些區域性區域的特徵

較深的卷積層具有較大的感知域,能夠學習到更加抽象一些的特徵

高層的抽象特徵對物體的大小、位置和方向等敏感性更低,從而有助於識別效能的提高, 所以我們常常可以將卷積層看作是特徵提取器
 

將全連線層轉為卷積層:

將濾波器的尺寸設定為和輸入資料體的尺寸一致, 這樣輸出就變為, 本質上和全連線層的輸出是一樣的