1. 程式人生 > >重溫目標檢測--SSD


針對目標檢測問題,本文側重的是 速度+精度 對於 300×300 影象,SSD achieves 74.3% mAP 1 on VOC2007 test at 59 FPS on a Nvidia Titan X



SSD 首先用一個 base network(一組卷積網路層組成) 1) Multi-scale feature maps for detection 在多尺度特徵圖上進行目標檢測

2) Convolutional predictors for detection 在每個尺度的特徵圖上使用 a set of convolutional filters 進行矩形框預測得到 a fixed set of detection predictions,對於一個尺寸為 m × n with p channels 的 特徵圖網路層,我們使用一個 3 × 3 × p small kernel 來預測矩形框引數,一個是類別概率,一個是位置資訊

3)Default boxes and aspect ratios 這裡的 default box 類似 Faster R-CNN 中的 anchor boxes,區別在於我們將其應用於不同尺寸的特徵圖上

4) Hard negative mining 控制正負樣本比例

5)Data augmentation 增加訓練樣本數量

The model loss is a weighted sum between localization loss (e.g. Smooth L1 [6]) and confidence loss (e.g. Softmax)


3.6 Data Augmentation for Small Object Accuracy 在這裡插入圖片描述