Cascade R-CNN 論文理解

阿新 • • 發佈：2019-01-10

paper：Cascade R-CNN: Delving into High Quality Object Detection
link：Cascade R-CNN paper
code：https://github.com/zhaoweicai/cascade-rcnn

摘要

在目標檢測中IOU(intersection over union)閾值用來判斷候選框是positive還是negative，IOU閾值的提高會降低檢測效能：
- 正樣本數量的急劇減少，會導致訓練過程過擬合；
- train和inference兩個階段的IOU閾值不同會導致mismatch；
提出Cascade R-CNN，由一系列在IOU逐漸增加的情況下訓練得到的檢測器組成訓練過程逐步進行，上一階段檢測器的輸出能提供使下階段訓練出更高質量檢測器的良好資料分佈；

引言

檢測器需要同時解決識別和檢測問題，需要面對大量的close false positives，與此同時需要找出true positive；

對比圖(a)和(b)發現當IOU閾值較低時有更多的誤檢；圖©的橫座標表示輸入的proposal和GT的IOU值，縱座標表示經過regression後bbox和GT的IOU值，從圖中可以發現在輸入IOU在 $[0.5,0.6]$ 區間內 $u=0.5$ 的performance最好，在 $[0.6,0.75]$ 區間內 $u=0.6$ 的performance最好，在 $[0.75,0.95]$ 區間內 $u=0.7$ 的performance最好；結論是：在不同IOU閾值情況下樣本的分佈不一樣，導致同一閾值不能cover到所有樣本，即proposal的IOU閾值和檢測器訓練閾值接近時檢測器的效能才最好(避免mismatch的問題)；
為了訓練高質量的檢測器，直接在訓練過程中提升IOU閾值是不可行的如圖(b)所示，當IOU閾值提高到0.6時AP有提升但是提高到0.7時AP就會明顯降低；原因：在訓練階段IOU閾值提升時，訓練過程的正樣本數量急劇減少,正負樣本資料更加不平衡，使得訓練過程更容易產生過擬合；
Cascade R-CNN的提出：既要保證proposal的同時又要保證正樣本的數量，從圖©的baseline可以看出，proposal在經過檢測器後和GT的IOU會增加，因此如果proposal再經過用更高IOU閾值訓練的檢測器那麼輸出結果的IOU會更高；由此針對Cascade R-CNN提出一個新的訓練思路：使用前一個stage的輸出去訓練下一個stage的檢測器，每經過一個檢測器proposal的IOU都會提高，那麼即使下一階段的檢測器在訓練的時候閾值設定提高也能保證正樣本的數量避免過擬合

目標檢測

本文Cascade R-CNN的思路主要是在Faster R-CNN圖(a)的基礎上進行拓展，加入一個多階段檢測子網路對RPN產生的proposal進行逐步的refine；

bbox迴歸

$L_{loc}$ 採用的是Faster RCNN中的Smooth L1 loss，其中bbox的encode和decode過程在這裡我就不復述了(和其他檢測框架的解析過程相同)；
圖(b)表示所有HEAD network都相同的iterative bbox操作，每階段的IOU閾值都相同，使得IOU在後面階段很難提升，有兩方面的問題：
- 圖一中的結論：單一的0.5IOU閾值無法cover所有IOU範圍的proposal；
- 每階段的檢測器會改變樣本IOU的分佈，使用相同的IOU閾值不合適；圖二兩行圖示分別表示bbox(x,y,w,h)的偏移量和偏差量，每經過一個階段的refine資料的分佈改變很大，噪聲資料的IOU也會增大圖中紅點表示提高IOU閾值後移除的噪聲，refine過程可以理解為樣本的重取樣，在提高IOU閾值的情況下保證樣本的質量

檢測質量

在目標檢測中很難確定一個目標是正樣本還是負樣本，通常由IOU閾值來定義目標的類別屬性，因此IOU閾值作為定義檢測器質量的重要指標；
IOU的設定和檢測效能是矛盾對立的：閾值設定過高，訓練階段沒有足夠的正樣本；閾值設定過低會導致檢測器很難鑑別close false positive，出現嚴重的誤檢情況；總體來說單個分類器很難再多IOU level上有好的表現，由於RPN、selective search等proposal檢測器生成的proposal質量較低因此需要檢測器對低質量的proposal具有更強的鑑別能力；目前大多數訓練階段IOU設定標準是0.5，但是這個閾值還是偏低了導致檢測質量降低從而導致產生誤檢；

圖3©演算法方案為此使用了integral loss，使用不同的IOU閾值來對bbox進行分類然後融合分類結果進行類別的鑑定，但是沒有對bbox迴歸使用級聯結構；這種方案沒有解決不同loss所作用的正樣本數量不同的問題(這裡解釋有點繞口吧…其實就是老問題IOU越高正樣本越少)，圖4(a)可以看出隨著IOU的提升正樣本數量迅速減少，and高質量的分類器更容易overfitting…；雖然IOU提高了，分類器依然要處理大量低質量的proposal沒有得到優化，因此本質上檢測精度沒有得到什麼提升；

Cascade R-CNN

Cascade R-CNN結構如圖3(d)所示，上階段的bbox輸出作為下階段的輸入，每個階段的IOU閾值逐步增加(其實Cascade R-CNN的結構很簡單了，在Faster R-CNN RPN後面擴充套件了一個多階段檢測子網路)

Cascade R-CNN結構：backbone+RPN+3detector(iou:0.5,0.6,0.7)；
detector：two stage檢測器第二階段的設計思路，不同的是每個階段的輸入輸出是串聯的；

實驗結果

文中對比了Cascade R-CNN based on FPN+和ResNet-101結構和一些優秀演算法的對比，從AP指標上來看Cascade R-CNN對檢測精度的提升很大；

同時還比對了Cascade R-CNN的引數量和速度，從表中可以發現引數量增加得比較多，但是inference和training的速度影響不大；

總結

本文提出了一個級聯目標檢測器Cascade R-CNN，給高質量目標檢測器的設計提出一個好的方向；
Cascade R-CNN在提升IOU的同時避免了training階段的過擬合以及inference階段的檢測質量mismatch；
文中對比實驗很充分：
- 在proposal中新增GT bbox驗證檢測質量mismatch問題；
- 和iterative bbox和integral loss兩種方法進行對比；
- 通過調整stages的數目來分析合適級聯數，3stages級聯綜合表現最好；
- 在現有two stage演算法框架上加入cascade思想和原始實現進行對比；
- Cascade R-CNN帶來的檢測結果還是很優秀的；
檢測問題不同於分類問題，分類問題中樣本的label是離散的可以很好區分正負樣本，但是檢測問題中bbox的資訊不是離散的只能通過IOU閾值來判定正負樣本，並且合適IOU閾值沒法在訓練中通過學習來調整優化，所以Cascade R-CNN核心思想主要集中在IOU的優化上，算是在高質量目標檢測器設計思路上一次優秀的嘗試；

Cascade R-CNN 論文理解

paper：Cascade R-CNN: Delving into High Quality Object Detection link：Cascade R-CNN paper code：https://github.com/zhaoweicai/cascade-rcnn 摘要

【目標檢測】Cascade R-CNN 論文解析

都是 org 檢測 rpn 很多 .org 實驗 bubuko pro 目錄 0. 論文鏈接 1. 概述 @ 0. 論文鏈接 Cascade R-CNN 1. 概述 ??這是CVPR 2018的一篇文章，這篇文章也為我之前讀R-CNN系列困擾的一個問題提供了一個解決方案

Cascade R-CNN論文講解（轉載）

轉載連結：https://blog.csdn.net/qq_21949357/article/details/80046867 論文思想：為了解決IOU設定帶來的最終的AP值，作者引入了cascade結構的迴歸器，採用cascade R-CNN stages，用一個stage的輸出去訓練下一個stage，

目標檢測論文Cascade R-CNN: Delving into High Quality Object Detection

轉自：https://zhuanlan.zhihu.com/p/36095768 Cascade R-CNN: Delving into High Quality Object Detection 論文連結：https://arxiv.org/abs/1712.00726 程式碼連結：htt

【論文解析】Cascade R-CNN: Delving into High Quality Object Detection

論文連結 CVPR2018的文章。和BPN一樣，本文主要關注的是目標檢測中IoU的閾值選取問題，但是BPN主要針對的是SSD等single-stage的detector，感興趣的童鞋可以看我的另一篇博文BPN 目標檢測中，detector經常是用低IoU閾值來train的，如果提高IoU閾值

目標檢測論文閱讀：Cascade R-CNN: Delving into High Quality Object Detection

Cascade R-CNN: Delving into High Quality Object Detection 樣本減少引發的過擬合在train和inference使用不一樣的閾值很容易導致mismatch(這一點在下面會有解釋) 作者為

【譯】Cascade R-CNN：Delving into High Quality Object Detection論文翻譯

CVPR 2018年論文：Cascade R-CNN----------------------------------------------------------------------------------------------------博主也是正在看這篇論文，

Cascade R-CNN的一些記錄

Cascade R-CNN的一些記錄《Cascade R-CNN: Delving into High Quality Object Detection》CVPR2018的一篇文章論文連結：https://arxiv.org/abs/1712.00726 程式碼連結：ht

Fast R-CNN（理解）

0 - 背景　　經典的R-CNN存在以下幾個問題：訓練分多步驟（先在分類資料集上預訓練，再進行fine-tune訓練，然後再針對每個類別都訓練一個線性SVM分類器，最後再用regressors對bounding box進行迴歸，並且bounding box還需要通過selective searc

Faster R-CNN論文及原始碼解讀

R-CNN是目標檢測領域中十分經典的方法，相比於傳統的手工特徵，R-CNN將卷積神經網路引入，用於提取深度特徵，後接一個分類器判決搜尋區域是否包含目標及其置信度，取得了較為準確的檢測結果。Fast R-CNN和Faster R-CNN是R-CNN的升級版本，在準確率和實時性方面都得到了較大提升。在F

Fast R-CNN論文學習

R-CNN論文學習 Abstract 1. Introduction 1.1 R-CNN 和 SPPnet R-CNN的問題 SPPnet的改進和問題 1.2 本論文的貢獻

Faster R-CNN 論文學習

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 演算法簡介 Abstract 1. Introduction 2. Relat

Fast R-CNN論文筆記

本文分兩個部分，第一個部分是論文的筆記，第二個部分是結合程式碼來看fast-RCNN。論文部分：主要是為了對RCNN，SPPnet的效果上的改進，下面簡述了一些RCNN的缺點： Training is a multi-stage pipeline Training

[Network Architecture]Mask R-CNN論文解析（轉）

前言最近有一個idea需要去驗證，比較忙，看完Mask R-CNN論文了，最近會去研究Mask R-CNN的程式碼，論文解析轉載網上的兩篇部落格技術挖掘者 remanented 文章1 論文題目：Mask R-CNN 論文連結：論文連結論文程式碼：Facebook程式

R-CNN論文翻譯:豐富的功能層次結構，用於精確的物件檢測和語義分割

R-CNN論文地址：R-CNN R-CNN專案地址: http://www.rossgirshick.info/ 摘要在典型的PASCAL VOC資料集上測量的物件檢測效能在過去幾年中已經穩定下來。最好的方法是複雜的系統，通常將多個低階影象特徵與高階語境相結合。在本文中，我們

R-CNN論文詳解（學習筆記）

R-CNN:基於候選區域的目標檢測 Region proposals 基本概念(看論文前需要掌握的)： 1.cnn(卷積神經網路):CNN從入門到精通（初學者） 2.Selective search:選擇性搜素 3.warp:圖形region變換 4.Supervised pre-t

王權富貴論文篇：Faster R-CNN論文翻譯——中英文對照

文章作者：Tyan 感謝Tyan作者大大，相見恨晚，大家可以看原汁原味的Tyan部落格哦。部落格：noahsnail.com | CSDN | 簡書宣告：作者翻譯論文僅為學習，如有侵權請聯

Mask R-CNN論文筆記

背景及大致思路 a. 何凱明基於Faster R-CNN提出的用於例項分割的結構框架。該框架在原本的結構上增加了用於預測mask的新支路，速度仍達到了5fps。同時，這個結構也能用於其他的視覺任務如檢測，人物關鍵點檢測。 b. 例項分割：是物體檢測和語義分割的結合，也就是要對每

Faster R-CNN網路的另一種優化思路：cascade R-CNN網路詳解

論文：Cascade R-CNN: Delving into High Quality Object Detection 論文地址：https://arxiv.org/pdf/1712.00726.pdf Github專案地址：https://github.com/zhaoweicai/

Mask R-CNN 論文筆記

論文題目：Mask R-CNN 論文連結：論文連結論文程式碼：Facebook程式碼連結；Tensorflow版本程式碼連結； Keras and TensorFlow版本程式碼連結；MxNet版本程式碼連結一、Mask R-CNN

Cascade R-CNN 論文理解

摘要

引言

相關工作

目標檢測

bbox迴歸

分類

檢測質量

Cascade R-CNN

實驗結果

總結

相關推薦