Faster R-CNN 目標檢測演算法詳細總結分析（two-stage)(深度學習)(NIPS 2015)

阿新 • • 發佈：2018-11-24

論文名稱：《 Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 》

論文下載：https://papers.nips.cc/paper/5638-faster-r-cnn-towards-real-time-object-detection-with-region-proposal-networks.pdf

論文程式碼：https://github.com/rbgirshick/py-faster-rcnn

1. 網路結構

Faster R-CNN可以簡單地看做“區域生成網路RPNs + Fast R-CNN”的系統，用區域生成網路代替Fast R-CNN中的Selective Search方法。

2. 訓練

RPN與Fast-R-CNN共享卷積層，使用4-step交替訓練法進行RPN和Fast R-CNN的訓練。

四步交替訓練：

（1）訓練RPN，使用ImageNet預訓練模型對RPN進行初始化，並進行端到端微調。

（2）使用由步驟1 RPN生成的候選框，通過Fast R-CNN訓練單獨的檢測網路。該檢測網路也由ImageNet預訓練模型初始化。

（3）使用檢測網路初始化RPN訓練，固定共享的卷積層，只微調RPN特有的層。現在這兩個網路共享卷積層。

（4）保持共享卷積層固定，微調Fast R-CNN獨有的層。

3. 測試過程

（1）首先向CNN網路【ZF或VGG-16】輸入任意大小圖片；

（2）經過CNN網路前向傳播至最後共享的卷積層，一方面得到供RPN網路輸入的特徵圖，另一方面繼續前向傳播至特有卷積層，產生更高維特徵圖；

（3）供RPN網路輸入的特徵圖經過RPN網路得到區域建議和區域得分，並對區域得分採用非極大值抑制【閾值為0.7】，輸出其Top-N【文中為300】得分的區域建議給RoI池化層；

（4）第2步得到的高維特徵圖和第3步輸出的候選框同時輸入RoI池化層，提取對應候選框的特徵；

（4）第4步得到的候選框特徵通過全連線層後，輸出該區域的分類得分以及迴歸後的bounding-box。

4. 創新點

用RPN網路來代替耗時的Selective Search方法來生成候選框，提高檢測速度。
RPN網路與檢測網路共享卷積特徵，使生成候選框的成本幾乎降為零。

5. 存在問題

（1）仍然不能實時進行目標檢測。

（2）還是沒有一種簡單得到候選框的方法。

Faster R-CNN 目標檢測演算法詳細總結分析（two-stage)(深度學習)(NIPS 2015)

論文名稱：《 Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 》論文下載：https://papers.nips.cc/paper/5638-faster-r-cnn-t

Fast R-CNN 目標檢測演算法詳細總結分析（two-stage)(深度學習)(ICCV 2015)

論文名稱：《 Fast R-CNN 》論文下載：https://arxiv.org/pdf/1504.08083.pdf 論文程式碼：https://github.com/rbgirshick/fast-rcnn 一、網路結構：

R-CNN 目標檢測演算法詳細總結分析（two-stage)(深度學習)(CVPR 2014)

論文名稱：《 Rich feature hierarchies for accurate object detection and semantic segmentation 》論文下載：https://arxiv.org/pdf/1311.2524.pdf 論文程式碼：ht

YOLOv3 目標檢測演算法詳細總結分析（one-stage)(深度學習)(CVPR 2018)

論文名稱：《 YOLOv3: An Incremental Improvement 》論文下載：https://pjreddie.com/media/files/papers/YOLOv3.pdf 論文程式碼: https://github.com/pjredd

YOLOv2 目標檢測演算法詳細總結分析（one-stage)(深度學習)(CVPR 2017)

論文名稱：《 YOLO9000: Better, Faster, Stronger 》論文下載: https://arxiv.org/abs/1612.08242 論文程式碼: http://pjreddie.com/yolo9000/ 一、演算法

YOLOv1目標檢測演算法詳細總結分析（one-stage)(深度學習)(CVPR 2016)

論文名稱：《 You Only Look Once: Unified, Real-Time Object Detection 》論文連線：https://github.com/pjreddie/darknet 程式碼連線：http://arxiv.or

SSD 目標檢測演算法詳細總結分析（one-stage)(深度學習)(ECCV 2016)

論文名稱：《 SSD: Single Shot MultiBox Detector 》論文下載：https://arxiv.org/pdf/1512.02325.pdf 論文程式碼：https://github.com/weiliu89/caffe/tree/ssd

YOLT目標檢測演算法詳細總結分析（one-stage)(深度學習)(CVPR 2018)

論文名稱：《 You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery 》論文下載：https://arxiv.org/abs/1805.09512 論文程式碼：https://g

Relation-Network目標檢測演算法詳細總結分析（one/two-stage)(深度學習)(CVPR 2018)

論文名稱：《 Single-Shot Refinement Neural Network for Object Detection 》論文下載：https://arxiv.org/abs/1711.06897 論文程式碼：https://github.com/sfzhang1

RFBNet目標檢測演算法詳細總結分析（one/two-stage)(深度學習)(ECCV 2018)

論文名稱：《 Receptive Field Block Net for Accurate and Fast Object Detection 》論文下載：https://arxiv.org/pdf/1711.07767.pdf 論文程式碼：https://github.co

Soft-NMS目標檢測演算法詳細總結分析（one/two-stage)(深度學習)(ICCV 2017)

論文：《 Improving Object DetectionWith One Line of Code 》論文下載：https://arxiv.org/abs/1704.04503 論文程式碼：https://github.com/bharatsingh430/soft-nms

yolo 目標檢測演算法個人總結（yolov1）

yolo 目標檢測演算法個人總結目前yolo目標檢測有兩個版本，分別為v1和v2。因工作需要用yolo演算法檢測人物，所以這段時間重點看了這兩篇論文，並實現了對應的tensorflow程式碼。這裡記錄下在論文閱讀過程中的一些細節資訊，留給自己，同時也希望各位能指出本人

目標檢測演算法-特徵提取之（一）Haar特徵

1、Haar-like特徵 Haar特徵最先由Paul Viola等人提出，後經過Rainer Lienhart等擴充套件引入45°傾斜特徵。Haar特徵分為三類：邊緣特徵、線性特徵、中心特徵和對角線特徵，組合成特徵模板。OpenCV（2.4

Faster R-CNN Tensorflow實現之資料集製作（2）--- xml檔案的讀寫修改

接著上一篇的文章繼續製作自己的資料集，由於需要將資料集弄成與VOC 2007資料集一樣的格式，需要自己手動標註資料，根據網上前輩的經驗，這裡使用了labelImg，版本用了windows_v1 .7.0，操作簡單方便。使用該軟體進行標註後將直接生成以與圖片名稱相同的.XML檔

目標檢測演算法的演進（two-stage檢測演算法）：R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN、Mask R-CNN

什麼是目標檢測（object detection）：目標檢測（object detection），就是在給定的一張圖片中精確找到物體所在的位置，並標註出物體的類別。所以，目標檢測要解決的問題就是物體在哪裡以及是什麼的整個流程問題。但是，在實際照片中，物體的尺寸變化範圍很大，擺放物體的

論文筆記：目標檢測演算法（R-CNN，Fast R-CNN，Faster R-CNN，YOLOv1-v3）

R-CNN（Region-based CNN） motivation：之前的視覺任務大多數考慮使用SIFT和HOG特徵，而近年來CNN和ImageNet的出現使得影象分類問題取得重大突破，那麼這方面的成功能否遷移到PASCAL VOC的目標檢測任務上呢？基於這個問題，論文提出了R-CNN。基本步驟：如下圖

常用目標檢測演算法：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

一、目標檢測常見演算法 object detection，就是在給定的圖片中精確找到物體所在位置，並標註出物體的類別。所以，object detection要解決的問題就是物體在哪裡以及是什麼的整個流程問題。

目標檢測定位與分割論文閱讀心得總結：FCN U-Net R-CNN FR-CNN Faster R-CNN Mask R-CNN

目前，基於區域的方法主要分為兩類：任務解耦和的RCNN[1]和任務高度耦合的FCN[2]。 RCNN是將任務分解，目標檢測、定位與分割依次逐一進行，前者決定後者的輸入，因此稱為任務解耦和。而

目標檢測演算法綜述：R-CNN，faster R-CNN，yolo，SSD，yoloV2

1 引言深度學習目前已經應用到了各個領域，應用場景大體分為三類：物體識別，目標檢測，自然語言處理。上文我們對物體識別領域的技術方案，也就是CNN進行了詳細的分析，對LeNet-5 AlexNet VGG Inception ResNet MobileNet等各種優秀的模型

基於深度學習的目標檢測演算法：Faster R-CNN

問題引入： R-CNN、SPP net、Fast R-CNN等目標檢測演算法，它們proposals都是事先通過selecetive search方法得到。然而，這一過程將耗費大量的時間，從而影響目標檢測系統的實時性。Faster R-CNN針對這一問題，提

Faster R-CNN 目標檢測演算法詳細總結分析（two-stage)(深度學習)(NIPS 2015)

1. 網路結構

2. 訓練

3. 測試過程

4. 創新點

5. 存在問題

相關推薦