1. 程式人生 > >CVPR2018目標檢測相關論文總結

CVPR2018目標檢測相關論文總結

                                      CVPR2018目標檢測

1、Cascaded RCNN (相關度:

論文:Cascade R-CNN Delving into High Quality Object Detection 

創新點及結論:分析proposal的IOU與最後檢測的IOU間關係,得到結論: 當一個檢測模型採用某個閾值(假設u=0.6)來界定正負樣本時,那麼當輸入proposal的IOU在這個閾值(u=0.6)附近時,該檢測模型比基於其他閾值訓練的檢測模型的效果要好。

2、Relation Networks for Object Detection

 (相關度:★)

論文:Relation Networks for Object Detection 

創新點及結論: 模型學到object之間的關係, 在檢測過程中可以通過利用影象中object之間的相互關係或者叫影象內容(context)來優化檢測效果,這種關係既包括相對位置關係也包括影象特徵關係

3、RefineDet (相關度:

論文:Single-Shot Refinement Neural Network for Object Detection 

創新點及結論:one-stage combine with two-stage ,

SSD演算法和RPN網路、FPN演算法的結合,可以在保持SSD高效的前提下提高檢測效果。

4、SNIP (相關度:

論文:An Analysis of Scale Invariance in Object Detection – SNIP 

問題:從資料集出發進行了非常詳細的分析和實驗對比,發現在COCO資料集中小目標占比要比ImageNet資料集大,這樣在用ImageNt資料集的預訓練模型時就會產生domain-shift問題,另外COCO資料集中的object尺寸變化範圍非常大,即便採用multi-scale training的方式也很難訓練一個檢測器去cover所有scale的目標。

方法: 提出一種新的訓練模型的方式:Scale Normalization for Image Pyramids (SNIP),該演算法主要包含兩個改進點:1、為了減少前面所提到的domain-shift,在梯度回傳時只將和預訓練模型所基於的訓練資料尺寸相對應的ROI的梯度進行回傳。2、借鑑了multi-scale training的思想,引入影象金字塔來處理資料集中不同尺寸的資料

5、R-FCN-3000 (相關度:

論文:R-FCN-3000 at 30fps: Decoupling Detection and Classification 

創新點:R-FCN演算法(關於R-FCN演算法的介紹可以看部落格)應用在檢測類別較多的場景下

6、DES (相關度:

論文:Single-Shot Object Detection with Enriched Semantics 

創新點及方法:

Detection with Enriched Semantics(DES)主要是基於SSD做改進,也是為了解決SSD中對於小目標物體的檢測效果不好的問題,因為SSD演算法對小目標的檢測只是利用了淺層的特徵,並沒有用到高層的語義特徵。因此這篇文章的出發點就是為了增加用於檢測的feature map的語義資訊,主要的措施包括:1、引入segmentation module用於得到attention mask,從而提高low level的feature map的語義資訊。2、引入global activation module用於提高high level的feature map的語義資訊

7、STDN (相關度:

論文:Scale-Transferrable Object Detection 

創新點: Scale-Transferrable Detection Network(STDN)演算法主要用於提高object detection演算法對不同scale的object的檢測效果。

方法: 該演算法採用DenseNet網路作為特徵提取網路(自帶高低層特徵融合),基於多層特徵做預測(類似SSD),並對預測結果做融合得到最終結果。該演算法有兩個特點:1、主網路採用DenseNet,瞭解DenseNet的同學應該知道該網路在一個block中,每一層的輸入feature map是前面幾層的輸出feature map做concate後的結果,因此相當於高低層特徵做了融合。高低層特徵融合其實對object detection演算法而言是比較重要的,FPN演算法是顯式地做了高低層特徵融合,而SSD沒有,這也是為什麼SSD在小目標問題上檢測效果不好的原因之一,因此該演算法雖然看似SSD,但其實和SSD有區別。2、引入scale-transfer layer,實現了在幾乎不增加引數量和計算量的前提下生成大尺寸的feature map(其他常見的演算法基本上都是採用deconvolution或upsample),由於scale-transfer layer是一個轉換操作,因此基本不會引入額外的引數量和計算量。