重溫目標檢測--SSD
針對目標檢測問題,本文側重的是 速度+精度 對於 300×300 影象,SSD achieves 74.3% mAP 1 on VOC2007 test at 59 FPS on a Nvidia Titan X
SSD 首先用一個 base network(一組卷積網路層組成) 1) Multi-scale feature maps for detection 在多尺度特徵圖上進行目標檢測
2) Convolutional predictors for detection 在每個尺度的特徵圖上使用 a set of convolutional filters 進行矩形框預測得到 a fixed set of detection predictions,對於一個尺寸為 m × n with p channels 的 特徵圖網路層,我們使用一個 3 × 3 × p small kernel 來預測矩形框引數,一個是類別概率,一個是位置資訊
3)Default boxes and aspect ratios 這裡的 default box 類似 Faster R-CNN 中的 anchor boxes,區別在於我們將其應用於不同尺寸的特徵圖上
4) Hard negative mining 控制正負樣本比例
5)Data augmentation 增加訓練樣本數量
The model loss is a weighted sum between localization loss (e.g. Smooth L1 [6]) and confidence loss (e.g. Softmax)
3.6 Data Augmentation for Small Object Accuracy
11