Faster R-CNN網路的另一種優化思路：cascade R-CNN網路詳解

阿新 • • 發佈：2018-12-09

論文：Cascade R-CNN: Delving into High Quality Object Detection

論文地址：https://arxiv.org/pdf/1712.00726.pdf

Github專案地址：https://github.com/zhaoweicai/cascade-rcnn

在Faster R-CNN演算法中，我們需要確定IOU的閾值來區分正樣本和負樣本。低的閾值如0.5訓練網路，易產生檢測噪聲，但隨著IOU閾值的增加，檢測效能會降低。因此，我們提出了Cascade R-CNN（級聯R-CNN）演算法。

該演算法由一系列隨著IOU閾值增加而訓練的檢測器組成，循序漸進的對close false positive更具選擇性。檢測器被階段性地訓練，如果檢測器的輸出是一個好的分佈，則用於訓練下一個階段更好的檢測器。對逐漸改進的假設進行重取樣，保證所有的檢測器由一組同等大小的正樣本組成，緩解過擬合問題。在假設階段應用同樣的級聯程式，使得每一個階段的假設和檢測器的質量有一更匹配的效能。

直接提高IoU時候帶來的過擬合問題與Cascade R-CNN的提出：

IoU用來判斷候選框是正樣本還是負樣本，比如一般設IoU為0.5，＞0.5的作為正樣本。但是，IoU設為0.5這樣一個條件太鬆了，會有很多噪音框出現。

如果我們提高Iou，那麼又會帶來另一個問題，由於IoU是用來判斷正負樣本的，如果IoU值太大，用來訓練模型的正樣本就減少了，這會導致過擬合的問題。

如：

圖(a)中u=0.5也就是常用的正負樣本界定的閾值，但是當閾值取0.5時會有較多的誤檢，因為0.5的閾值會使得正樣本中有較多的背景，這是較多誤檢的原因；（b）用0.7的IOU閾值可以減少誤檢，但檢測效果不一定最好，主要原因在於IOU閾值越高，正樣本的數量就越少，因此過擬合的風險就越大。

圖(c)和(d)中的曲線是用來描述localization performance和detection performance，其中橫座標表示輸入的proposal和ground truth的IOU值，縱座標表示輸出的proposal和ground truth的IOU值。紅、綠、藍3條曲線代表訓練檢測模型時用的正負樣本標籤的閾值分別是0.7、0.6、0.5。

圖(c)中不同的線條代表不同的訓練用IoU閾值訓練出來的detector，顯然新的IoU越高，detector的regression的效能越好。另外，在圖(c)中可以看到在0.55~0.6的範圍內閾值為0.5的detector效能最好，在0.6~0.75閾值為0.6的detector效能最佳，而到了0.75之後就是閾值為0.7的detector了。

也就是說，只有proposal自身的閾值和訓練器訓練用的閾值較為接近的時候，訓練器的效能才最好。那麼我們能不能直接用較大的閾值（比如u=0.7）來訓練檢測模型呢？這樣是不行的，原因是較高的閾值會使得正樣本數量減少，這樣資料更加趨於不平衡，而且正樣本數量的減少會使得模型更容易過擬合。

在圖(d)中我們可以發現輸入的Iou從0.5開始增加後，detector的detection performance反而在不斷變差。

如何能保證proposal的高質量又不減少訓練樣本？

作者提出了cascade R-CNN模型，簡單來講cascade R-CNN是由一系列的檢測模型組成，每個檢測模型都基於不同IOU閾值的正負樣本訓練得到，前一個檢測模型的輸出作為後一個檢測模型的輸入，因此是stage by stage的訓練方式，而且越往後的檢測模型，其界定正負樣本的IOU閾值是不斷上升的。

我們看圖c中大部分線條都是在y=x的灰色線條之上的，這就說明某個proposal在經過detector後的IoU幾乎必然是增加的，那麼再經過一個更大閾值訓練的detector，它的IoU就會更好。

如：

根據圖(c)中資料，假如有三個串聯起來的用0.5/0.6/0.7的閾值訓練出來的detector，有一個IoU約為0.55的proposal，經過0.5的detector，IoU變為0.75；再經過0.6的detector，IoU變為0.82；再經過0.7的detector，最終IoU變為0.87，這比任何一個單獨的detector的結果都要好。每經過一個detector，proposal的IoU都更高，正樣本的質量會更好，即使下一個檢測器的IOU閾值設定的較高，也不會有太多的樣本被捨棄，能有效的緩解過擬合現象。

Cascade R-CNN的實現與結果：

作者最終確定的結構一共是4個stages: 1個RPN+3個檢測器(閾值設定分別為0.5/0.6/0.7)……RPN就是Faster R-CNN網路中的RPN。後面三個檢測器，則按照之前介紹，每個檢測器的輸入都是上一個檢測器進行了邊框迴歸後的結果，實現思路類似於Faster RCNN的第二階段。

結果如下：

作者的方法效果還是很驚豔的。另外，對於目前流行的檢測結構來說，特徵提取是耗時最多的，因此儘管Cascade R-CNN增加了比較多的引數，但是速度的影響並沒有想象中的大。

作者也比較了網路的耗時：

目標檢測與分類任務很大的不同就在於資料集的樣本沒有明確的區分正負樣本，在檢測任務中是通過設定IOU的值區分正負樣本，這就涉及到一個調參的問題，但是IoU這個指標很難通過gradient descent來優化，雖然之前也有一些IoU loss的工作，但是效果並不理想。Cascade R-CNN所提的方法，在前人的基礎上更進了一步。

Faster R-CNN網路的另一種優化思路：cascade R-CNN網路詳解

直接提高IoU時候帶來的過擬合問題與Cascade R-CNN的提出：

相關工作及比較證明：

Cascade R-CNN的實現與結果：

Faster R-CNN網路的另一種優化思路：cascade R-CNN網路詳解

另一種比較器：Comparator

mini2440開發板執行Qt程式出現Segmentation fault的另一種奇葩原因：Ubuntu下使用FileZilla通過FTP方式傳輸程式

linux環境下，連線另一臺伺服器的oracle資料庫，常見問題詳解

Java經典設計模式之十一種行為型模式（附例項和詳解）

卷積神經網路入門一種全卷積神經網路（LeNet），從左至右依次為卷積→子取樣→卷積→子取樣→全連線→全連線→高斯連線測試最後，為了檢驗 CNN 能否工作，我們準備不同的另一組圖片與標記集（不能在訓練

另一種實現非阻塞網路通訊的方法———使用libev

Android開發：“R cannot be resolved to a variable”的另一種解決方法

另一種的SQL註入和DNS結合的技巧

mysql 中的 not like 另一種簡化方法。

requestAnimationFrame，Web中寫動畫的另一種選擇

[Caffe]:關於*** Aborted at 1479432790 (unix time) try "date -d @1479432790" 錯誤的另一種原因

另一種思路比較2個日期是否相等的方式

linux安裝oracle的另一種方式

JAVA-初步認識-第六章-二維數組-另一種定義方式

python關於Decimal保留小數點後尾數的另一種方法

接口測試的另一種方式 – 接口測試平臺

利用Guzzle實現另一種PHP異步發送郵件(laravel5.4)

jar包引入interlij的另一種方法

排序_快速排序_另一種取劃分點的方法

Faster R-CNN網路的另一種優化思路：cascade R-CNN網路詳解

直接提高IoU時候帶來的過擬合問題與Cascade R-CNN的提出：

相關工作及比較證明：

Cascade R-CNN的實現與結果：

相關推薦