論文學習-深度學習目標檢測2014至201901綜述-Deep Learning for Generic Object Detection A Survey

阿新 • • 發佈：2019-02-14

visual 視覺尺度 iss https 展開 http stones 使用

寫在前面
目標檢測任務與挑戰
目標檢測方法匯總
基礎子問題
- 基於DCNN的特征表示
  - 主幹網絡（network backbone）
  - Methods For Improving Object Representation
- Context Modeling
- Detection Proposal Methods
- Other Special Issues
Datasets and Performance Evaluation

博客：blog.shinelee.me | 博客園 | CSDN

寫在前面

paper：https://arxiv.org/abs/1809.02165
github：https://github.com/hoya012/deep_learning_object_detection，A paper list of object detection using deep learning

這篇綜述對深度學習目標檢測2014至201901取得的進展進行了總結，包括：

More than 250 key contributions are included in this survey, covering many aspects of generic object detection research: leading detection frameworks

and fundamental subprob-lems including object feature representation, object proposal generation, context information modeling and training strategies; evaluation issues, specifically benchmark datasets, evaluation metrics, and state of the art performance.

本文的主要目的在於摘錄paper中的一些重要圖表和結論，作為系統學習的索引，不做詳細的展開。

下面兩張圖來自github，分別為paper list和performance table，紅色為作者認為必讀的paper。
技術分享圖片

目標檢測任務與挑戰

目標檢測任務的輸入是一張圖像，輸出是圖像中的物體位置和類別，如下圖所示，位置可通過Bounding Box描述，也可描述為像素的集合。
技術分享圖片
為了確定圖片中物體的位置和類別，要面臨很多挑戰，一個好的檢測器要做到定位準確、分類準確還要效率高，需要對光照、形變、尺度、視角、尺寸、姿態、遮擋、模糊、噪聲等情況魯棒，需要能容忍可能存在的較大的類內差異，又能區分開較小的類間差異，同時還要保證高效。
技術分享圖片

目標檢測方法匯總

在2012年前，目標檢測方法主要是人工特征工程+分類器，2012年後主要是基於DCNN的方法，如下圖所示：
技術分享圖片

目標檢測的框架可以分成2類：

Two stage detection framework：含region proposal，先獲取ROI，然後對ROI進行識別和回歸bounding box，以RCNN系列方法為代表。
One stage detection framework：不含region proposal，將全圖grid化，對每個grid進行識別和回歸，以YOLO系列方法為代表。

Pipeline對比與演化如下：
技術分享圖片
主幹網絡、檢測框架設計、大規模高質量的數據集是決定檢測性能的3個最重要的因素，決定了學到特征的好壞以及特征使用的好壞。

基礎子問題

這一節談論的重點包括：基於DCNN的特征表示、候選區生成、上下文信息、訓練策略等。

基於DCNN的特征表示

主幹網絡（network backbone）

ILSVRC（ImageNet Large Scale Visual Recognition Competition）極大促進了DCNN architecture的改進，在計算機視覺的各種任務中，往往將這些經典網絡作為主幹網絡（backbone），再在其上做各種文章，常用在目標檢測任務中的DCNN architectures如下：
技術分享圖片

Methods For Improving Object Representation

物體在圖像中的尺寸是未知的，圖片中的不同物體尺寸也可能是不同的，而DCNN越深層的感受野越大，因此只在某一層上進行預測顯然是難以達到最優的，一個自然的想法是利用不同層提取到的信息進行預測，稱之為multiscale object detection，可分成3類：

Detecting with combined features of multiple CNN layers
Detecting at multiple CNN layers;
Combinations of the above two methods

直接看圖比較直觀：
技術分享圖片

嘗試對幾何變形進行建模也是改善Object Representation的一個方向，方法包括結合Deformable Part based Models (DPMs)的方法、Deformable Convolutional Networks (DCN)方法等。

Context Modeling

上下文信息可以分為3類：

Semantic context: The likelihood of an object to be found in some scenes but not in others;
Spatial context: The likelihood of finding an object in some position and not others with respect to other objects in the scene;
Scale context: Objects have a limited set of sizes relative to other objects in the scene.

DCNN通過學習不同抽象層級的特征可能已經隱式地使用了contextual information，因此目前的state-of-art目標檢測方法並沒有顯式地利用contextual information，但近來也有一些顯式利用contextual information的DCNN方法，可分為2類：Global context和Local context。

技術分享圖片

技術分享圖片
感覺可以在某種程度上看成是數據層面的集成學習。

Detection Proposal Methods

Two stage detection framework需要生成ROI。

生成ROI的方法，可以分為Bounding Box Proposal Methods和Object Segment Proposal Methods，前者回歸出Bounding Box來描述ROI，後者通過分割得到像素集合來描述ROI。
技術分享圖片

Other Special Issues

通過data augmentation tricks（數據增廣）可以得到更魯棒的特征表示，可以看成是數據層面上的集成學習，考慮到物體尺度可大可小的問題，scaling是使用最多的數據增廣方法。
技術分享圖片

Datasets and Performance Evaluation

技術分享圖片

技術分享圖片

以上。

論文學習-深度學習目標檢測2014至201901綜述-Deep Learning for Generic Object Detection A Survey

visual 視覺尺度 iss https 展開 http stones 使用目錄寫在前面目標檢測任務與挑戰目標檢測方法匯總基礎子問題基於DC

論文學習-深度學習目標檢測2014至201901綜述-Deep Learning for Generic Object Detection A Survey

寫在前面

目標檢測任務與挑戰

目標檢測方法匯總

基礎子問題

基於DCNN的特征表示

主幹網絡（network backbone）

Methods For Improving Object Representation

Context Modeling

Detection Proposal Methods

Other Special Issues

Datasets and Performance Evaluation

論文學習-深度學習目標檢測2014至201901綜述-Deep Learning for Generic Object Detection A Survey

Deep Learning for Generic Object Detection: A Survey -- 目標檢測綜述總結

基於深度學習的雷達目標檢測識別——寫在畢業前

【深度學習：目標檢測】RCNN學習筆記(1):Rich feature hierarchies for accurate object detection and semantic segmentat

基於深度學習的【目標檢測】演算法綜述

機器視覺 OpenCV—python 基於深度學習的實時目標檢測

深度學習CNN用於目標檢測的方法總結

Joint Deep Learning For Pedestrian Detection（論文筆記-深度學習：行人檢測）

弱監督學習和小目標檢測

cs231n學習筆記 CNN 目標檢測定位分割

cs231n學習筆記-CNN-目標檢測定位分割

【機器學習】傳統目標檢測演算法之級聯分類器Cascade

cs231n學習筆記-CNN-目標檢測、定位、分割

論文筆記---深度學習之VGG模型解讀

OpenCV 學習筆記07 目標檢測與識別

IJCAI_論文-深度學習-Deep Learning for Event-Driven Stock Prediction

深度學習論文翻譯解析（八）：Rich feature hierarchies for accurate object detection and semantic segmentation

最實用的深度學習教程 Practical Deep Learning For Coders (Kaggle 冠軍 Jeremy Howard 親授)

機器學習/深度學習問題總結及解答

唐宇迪-機器學習/深度學習系列課程福利大發送！不單優惠還送機器學習必備實戰書籍！

論文學習-深度學習目標檢測2014至201901綜述-Deep Learning for Generic Object Detection A Survey

寫在前面

目標檢測任務與挑戰

目標檢測方法匯總

基礎子問題

基於DCNN的特征表示

主幹網絡（network backbone）

Methods For Improving Object Representation

Context Modeling

Detection Proposal Methods

Other Special Issues

Datasets and Performance Evaluation

相關推薦