1. 程式人生 > >Faster R-CNN 論文學習

Faster R-CNN 論文學習

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks


論文地址:
https://arxiv.org/pdf/1506.01497.pdf
.
Reference: https://blog.csdn.net/App_12062011/article/details/67638161.

本論文是R-CNN 目標檢測的第三篇論文,作者包括何凱明,Ross Girshick等大牛,值得一讀。

Faster R-CNN與此前的R-CNN和Fast R-CNN相比較,目標檢測的四個基本步驟(候選區域生成,特徵提取,分類,位置精修)終於被統一到一個深度網路框架之內。所有計算沒有重複,完全在GPU中完成,大大提高了執行速度:

演算法簡介

Faster-RCNN:

(1)輸入測試影象;

(2)將整張圖片輸入CNN,進行特徵提取;

(3)用 RPN(Region Proposal Network) 生成建議視窗(proposals),每張圖片生成300個建議視窗;

(4)把建議視窗對映到CNN的最後一層卷積feature map上;

(5)通過 RoI pooling層使每個RoI生成固定尺寸的feature map;

(6)利用 Softmax Loss(探測分類概率) 和Smooth L1 Loss(探測邊框迴歸)對分類概率和邊框迴歸(Bounding box regression)聯合訓練。

相比 Fast-RCNN,主要兩處不同

:

(1)使用RPN代替原來的Selective Search方法產生建議視窗;

(2)產生建議視窗的CNN和目標檢測的CNN共享。

改進:

(1) 如何高效快速產生建議框?

Faster R-CNN創造性地採用卷積網路自行產生建議框,並且和目標檢測網路共享卷積網路,使得建議框數目從原有的約2000個減少為300個,且建議框的質量也有本質的提高。

Abstract

目前state of art 的目標檢測網路都依賴於region proposal 演算法來假設物件的位置。SPPnet 和 Fast R-CNN 演算法顯著地降低了這些檢測網路的執行時間,但同時顯示region proposal 的計算是個瓶頸。這篇論文引入了 Region Proposal Network(RPN),它與檢測網路共享全圖卷積特徵,使得region proposal 的計算成本幾乎可忽略不計。RPN 通過訓練生成高質量的 region proposal,供Fast R-CNN 用於檢測。而且作者將 RPN 和Fast R-CNN 融為一個網路,共享卷積特徵,RPN 告訴這個大網路該看向哪裡。對於很深的VGG-16網路,此網路在GPU上的幀速是5fps,其在PASCAL VOC 2007, 2012, 和 MS COCO資料集上只需每張圖片300個 proposal即可達到 state of art 的準確率。

1. Introduction

在不同的proposals 間共享卷積,這點極大地降低了網路計算成本。但是在測試階段,proposals 仍是主流檢測系統速度提升的一大瓶頸。Region proposal (Selective Search) 方法所需的特徵和計算方法都不復雜,但是與檢測網路比,它還是慢了一大截子。

作者觀察到檢測器所用的卷積特徵圖也能被用於生成region proposals. 這篇論文在演算法層面改進了Fast R-CNN,它用深度神經網路來計算 proposal。這樣因為已有的檢測網路, proposal 的計算幾乎是free的。RPN在這裡面與目標檢測網路共享卷積層,這樣計算proposal 的邊際成本就很低了。在這些卷積層上再增加一些額外的卷積層,這些卷積層同時計算迴歸出region 的邊界和分數。

這篇論文引入了“anchor” boxes, 在不同的尺度和高寬比上作為參照。這樣,本模型只用一張單一尺度的圖片即可訓練和測試,因而速度快了許多。

為了整合RPNs 和 Fast R-CNN 目標檢測網路,作者提出了一種新的訓練框架,交替地微調 region proposal 任務和目標檢測任務。這樣,網路不僅收斂的快,而且網路的卷積特徵能被兩個不同的任務共享使用。

2. Related Work

3. Faster R-CNN

Faster R-CNN 由兩個模組組成。第一個模組是深度全卷積網路來提出候選區域,第二個模組是Fast R-CNN 檢測器來使用這些候選區域。RPN 模組告訴Fast R-CNN 應該看哪裡。

3.1 Region Proposal Networks

RPN 的輸入是一張圖片,輸出是一個由矩形目標候選區域組成的集合,每個候選區域都有一個分數。因為作者假定RPN 與Fast R-CNN 應該共享計算過程,這樣兩個網路應共享一組卷積層。

網路的最後一個共享卷積層輸出特徵圖,在這個特徵圖上滑動一個mini 網路來產生候選區域。往這個mini 網路裡輸入一個特徵圖上 n × n n\times n 的視窗,每個滑動視窗被對映為低維特徵,然後將這個特徵輸入2個sibling 全連線層 — box-regression 層 ( r e g reg ) 和 box-classification 層 ( c l s cls ) 。作者使用 n = 3 n=3 在這篇論文裡。注意,mini 網路是以滑動視窗的形式操作,所以全連線層對所有的空間位置是共享的。下圖是mini 網路在單個點的情況:

3.1.1 Anchors

在每個滑動窗位置,同步預測多個候選區域,每個位置的最大候選區域個數用 k k 表示。所以 r e g reg 層有 4 k 4k 個輸出,表示 k k 個box 的座標, c l s cls 層有 2 k 2k 個分數,表示是和不是目標類的概率。 k k 個候選區域由 k k a n c h o r s anchors 來引數表示。 a n c h o r anchor 位於滑動視窗的中心位置,都有一個scale尺度和一個aspect ratio高寬比。作者預設用了3種尺度和3種高寬比,所以在每個滑動位置一共有9個 a n c h o r s anchors 。對於一個 W × H W\times H 的卷積特徵圖,就一共有 W × H × k W\times H\times k 個anchors。所有的anchors都具有尺度不變性。

3.1.2 損失函式

在訓練RPN時,給每個anchor一個二分類的類標籤。給兩類anchor正的標籤:

  • anchor與ground-truth box的IoU最高;
  • 與任一ground-truth box的IoU高於0.7;

一個ground-truth box可能給多個anchors正的標籤。在有些情況中,第二個條件可能不能被滿足,那就使用第一個條件了。如果一個anchor與ground-truth box的IoU低於0.3,則給它一個負標籤。訓練過程中不考慮既不是正的也不是負的anchor。

損失函式定義如下: L ( { p i } , { t i } ) = 1 N c l s i L c l s ( p i , p i ) + λ 1 N r e g i p i L r e g ( t i , t i ) . L(\{p_i\},\{t_i\})=\frac{1}{N_{cls}}\sum_i L_{cls}(p_i, p_i^*)+\lambda\frac{1}{N_{reg}}\sum_i p_i^* L_{reg}(t_i, t_i^*).

i i 是mini-batch中anchor的索引, p i p_i 是anchor i i 預測的概率, p i p_i^* 是ground-truth 標籤,如果anchor是正的,就是1,否則是0。 t i t_i 是預測的邊框座標, t i t_i^* 是ground-truth box的座標。 L c l s L_{cls} 是二分類的log loss。對於迴歸損失函式,用 L r e g ( t i , t i ) = R ( t i t i ) L_{reg}(t_i, t_i^*) = R(t_i - t_i^*) R R 是robust loss function。 p i L r e g p_i^* L_{reg} 意味著僅當anchor是正的時候,迴歸損失才被啟用。 c l s cls r e g reg 層的輸出分別包含 p i {p_i} t i . {t_i}.

損失函式被 N c l s N_{cls} N r e g N_{reg} 歸一化, N c l s N_{cls} 代表了mini-batch的大小, N r e g N_{reg} 代表了anchor的個數。 λ \lambda 用於平衡前項和後項,預設值是10。

對於bounding box迴歸分析,對4個座標採用如下的引數化處理:
t x = ( x x a ) / w a , t y = ( y y a ) / h a , t_x = (x-x_a)/w_a, t_y=(y-y_a)/h_a,

相關推薦

Faster R-CNN 論文學習

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 演算法簡介 Abstract 1. Introduction 2. Relat

Faster R-CNN論文及原始碼解讀

R-CNN是目標檢測領域中十分經典的方法,相比於傳統的手工特徵,R-CNN將卷積神經網路引入,用於提取深度特徵,後接一個分類器判決搜尋區域是否包含目標及其置信度,取得了較為準確的檢測結果。Fast R-CNN和Faster R-CNN是R-CNN的升級版本,在準確率和實時性方面都得到了較大提升。在F

Fast R-CNN論文學習

R-CNN論文學習 Abstract 1. Introduction 1.1 R-CNN 和 SPPnet R-CNN的問題 SPPnet的改進和問題 1.2 本論文的貢獻

王權富貴論文篇:Faster R-CNN論文翻譯——中英文對照

文章作者:Tyan  感謝Tyan作者大大,相見恨晚,大家可以看原汁原味的Tyan部落格哦。 部落格:noahsnail.com  |  CSDN  |  簡書 宣告:作者翻譯論文僅為學習,如有侵權請聯

Faster R-CNN論文詳解

廢話不多說,上車吧,少年 &創新點 設計Region Proposal Networks【RPN】,利用CNN卷積操作後的特徵圖生成region proposals,代替了Selective Search、EdgeBoxes等方法,速度上提

Faster R-CNN論文翻譯——中文版

文章作者:Tyan 部落格:noahsnail.com  |  CSDN  |  簡書 宣告:作者翻譯論文僅為學習,如有侵權請聯絡作者刪除博文,謝謝! Faster R-CNN: Towards Real-Time Object Detection w

faster R-CNN 論文閱讀

Faster R-CNN 論文閱讀 1. Introduction 目標檢測在region proposal 方法的推動下獲得了很大成功,SPP-Net和fast R-CNN使用共享卷積層加速了計算速度,目前在test階段的瓶頸在於region prop

關於RPN中proposal的座標迴歸引數的一點理解及Faster R-CNN學習資料

在Faster R-CNN的區域生成網路RPN中為了能夠以目標真實框(Ground Truth box)為監督訊號去訓練RPN網路依據anchor預測proposal的位置,作者並不是直接回歸proposal的(x,y,w,h),而是採用了以下形式的引數化座標偏移向量

深度學習論文翻譯解析(四):Faster R-CNN: Down the rabbit hole of modern object detection

論文標題:Faster R-CNN: Down the rabbit hole of modern object detection 論文作者:Zhi Tian , Weilin Huang, Tong He , Pan He , and Yu Qiao 論文地址:https://tryolab

RCNN學習筆記(7):Faster R-CNN 英文論文翻譯筆記

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks Shaoqing Ren, Kaiming He, Ross Girshick, Jian Sun refere

[論文學習]《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 》

faster R-CNN的主要貢獻 提出了 region proposal network(RPN),通過該網路我們可以將提取region proposal的過程也納入到深度學習的過程之中。這樣做既增加了Accuracy,由降低了耗時。之所以說增加Accura

深度學習論文翻譯解析(十三):Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

論文標題:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks   標題翻譯:基於區域提議(Region  Proposal)網路的實時目標檢測 論文作者:Shaoqing Ren, K

論文閱讀筆記(六)Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

采樣 分享 最終 產生 pre 運算 減少 att 我們 作者:Shaoqing Ren, Kaiming He, Ross Girshick, and Jian SunSPPnet、Fast R-CNN等目標檢測算法已經大幅降低了目標檢測網絡的運行時間。可是盡管如此,仍然

Faster R-CNN 英文論文翻譯筆記

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks Shaoqing Ren, Kaiming He, Ross Girshick, Jian Sun reference link:ht

Faster R-CNN 目標檢測演算法詳細總結分析(two-stage)(深度學習)(NIPS 2015)

論文名稱:《 Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 》 論文下載:https://papers.nips.cc/paper/5638-faster-r-cnn-t

Faster R-CNN 學習筆記

Faster RCNN 學習 Faster R-CNN這篇論文著重解決了這個系統中的三個問題: 1. 如何設計區域生成網路;RPN 2. 如何訓練區域生成網路; 3. 如何讓區域生成網路和Fast RCNN網路共享特徵提取網路。 圖1:Faster RCNN 結構 Fa

R-CNN論文詳解(學習筆記)

R-CNN:基於候選區域的目標檢測 Region proposals 基本概念(看論文前需要掌握的): 1.cnn(卷積神經網路):CNN從入門到精通(初學者) 2.Selective search:選擇性搜素 3.warp:圖形region變換 4.Supervised pre-t

Faster R-CNN:利用區域提案網路實現實時目標檢測 論文翻譯

Faster R-CNN論文地址:Faster R-CNN Faster R-CNN專案地址:https://github.com/ShaoqingRen/faster_rcnn 摘要 目前最先進的目標檢測網路需要先用區域提案演算法推測目標位置,像SPPnet1和Fast R-CNN2

[深度學習]Object detection物體檢測之Faster R-CNN(5)

目錄 1.綜述 2.Region Proposal Networks (RPN) Anchor(錨) loss function Training RPNs 3.Sharing Features for RPN and Fast R-CNN  1.交替訓練&nb

論文閱讀筆記二十六:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks(CVPR 2016)

論文源址:https://arxiv.org/abs/1506.01497 tensorflow程式碼:https://github.com/endernewton/tf-faster-rcnn 摘要       目標檢測依賴於區域proposals演算法對目標的位置進