1. 程式人生 > >論文閱讀-《Object Detection Networks on Convolutional Feature Maps》

論文閱讀-《Object Detection Networks on Convolutional Feature Maps》

收錄於IEEE Transactions on Pattern Analysis and Machine Intelligence 2015

1.Background&Motivation

  • 論文的背景是Fast/Faster R-CNN成為當時的檢測精度最高的框架,同時Resnet剛發表不久,這個時候,基於迴歸模型的目標檢測框架還沒有發表。
  • 作者在論文一開始的時候提出了,基於region proposal的目標檢測框架,隨著前面的特徵提取的網路的深度不斷增加,整個目標檢測系統的精度也在不斷提高。但是人們並沒有對後面的region-wise的分類器做太多的關注,fast/faster r-cnn用的分類器都是普通的多層感知器。
  • 所以本文的觀點在於,後面的region-wise的分類器和前面的特徵提取網路,對於提高檢測精度一樣重要。

2.Proposal

作者自己的觀點可以總結為兩點
1. a deep region-wise classifier is important for object detection accuracy , in addition to deep shared features
2. convolutional layers for extracting region-wise features are effective and are complementary to the effects for extracting full-image shared features

3.Experiments

基本的實驗框架如下圖所示
Noc_1
通過一個ROI Pooling將前面的feature extractor和後面的object classifier連線起來

  • 實驗一(MLP)
    Noc_ex1
    第一組實驗,feature extractor用的是ZF Net,經過ROI pooling之後得到的region feature是固定大小的。這裡的四個對比項,第一行是直接用region feature訓練SVM,下面三行用的是不同數量的fc層。結果表明MLP越深,檢測效果越好

  • 實驗二(Conv)
    Noc_ex2
    第二組實驗,參照是原來的3層MLP,通過增加classifier當中卷積層的個數,觀察檢測的結果。在VOC07上的結果精度的下降作者解釋是因為07的資料量太少了,出現了過擬合,在07+12上訓練之後,加了卷積層的效果更好。

  • 實驗三(fine-tune)
    Noc_ex2
    第三組實驗做的是classifier的引數採用隨機初始化以及fine-tune的對比。這裡的maxout其實是用了一下多尺度的輸入。可以看到對classifier進行fine-tune的效果會更好。這裡fine-tune的引數來自前人訓練好的3fcMLP

  • 實驗四(error analysis)
    Noc_ex2
    通過縱向的對比,可以看出通過加深feature extractor,可以減少recognition error ,通過橫向的對比,可以看出通過設計良好的classifier,可以減少localizaition error。可見後面的classifer和前面的feature extractor是一樣重要的。

  • 實驗五(faster rcnn with resnet)
    Noc_ex2
    第五組實驗,作者拿了更深的googlenet和resnet做實驗,說明一個良好設計的classifier對於這種深層次,全卷積的網路在目標檢測的應用有著很大的作用。首先作者直接拿vgg16、googlenet以及resnet的模型,直接在最後一個卷積層的後面加上ROI-pooling,可以看到,在stride同樣等於16的時候,3fc的vgg效果要比1fc的googlenet和resnet還要好,即使googlenet和resnet擁有更深的特徵提取網路。當然,如果我們增加googlenet和resnet的MLP的層數的話,他們檢測的精度也會上升,加入卷積層的話,又要比MLP要好。從resnet的最後兩行可以看出,Noc主要是提高了localization的準確度,[email protected]幾乎沒變,但是[email protected]提高了。[email protected]提高了,如果是因為recogniton提高的話,那麼[email protected]也應該也提高,但是幾乎沒變,但是如果在localization提高的話,在0.75可以體現,但是在0.5可能就體現不出來,因為是在大於0.5的基礎上提高的。

相關推薦

論文閱讀-《Object Detection Networks on Convolutional Feature Maps

收錄於IEEE Transactions on Pattern Analysis and Machine Intelligence 2015 1.Background&Motivation

顯著性論文閱讀Saliency Detection with Recurrent Fully Convolutional Networks

摘要 深度網路已經被證明可以編碼高階語義特徵,並在顯著性檢測中提供卓越的效能。 在本文中,我們通過使用迴圈完全卷積網路(RFCN)開發新的顯著性模型更進一步。此外,迴圈體系結構使我們的方法能夠通過糾正其先前的錯誤自動學習優化顯著性對映。 為了訓練具有多個引數的這樣的網路,我們提出了使用語

論文閱讀筆記二十三:Rich feature hierarchies for accurate object detection and semantic segmentation Tech report(R-CNN CVPR2014)

論文源址:http://www.cs.berkeley.edu/~rbg/#girshick2014rcnn 摘要        在PASCAL VOC資料集上,最好的方法的思路是將低階資訊與較高層次的上下文資訊進行結合。該文的兩個亮點:(1)將CNN應用到re

目標檢測論文閱讀:Relation Networks for Object Detection

Relation Networks for Object Detection 論文連結:https://arxiv.org/abs/1711.11575 程式碼連結:暫無,尚不清楚是否會公開 這個是CVPR 2018的文章,雖然並沒有什麼巧妙的設

論文閱讀-《Relation Networks for Object Detection

MSRA jifeng dai 1.abstract: 在目標檢測領域,model object之間的關係能夠提高檢測的準確度,但是這種方法在基於深度學習的模型中還沒有很好的work。當下主流的目標檢測的方法還是對各個物體進行單獨的檢測,本文提出了一種o

論文閱讀】Long-Term Recurrent Convolutional Networks for Visual Recognition and Description

【論文閱讀】Long-Term Recurrent Convolutional Networks for Visual Recognition and Description 這篇文章是15年的一篇文章,文章設計了CNN+LSTM的網路結構用於行為識別、影象描述、視訊描述。因為我研究行為

論文閱讀筆記】-《Quantized Convolutional Neural Networks for Mobile Devices》

      Quantized -CNN是一種卷積神經網路量化框架,在測試階段可以進行計算加速和模型壓縮。移動裝置可以利用Quantized -CNN框架進行有效的時實影象分類,只有極小的準確性損失。文章測試的硬體平臺是華為mate10,在在ILSVRC-12基準測試

論文閱讀:Memory Networks

users 方式 article div local 網絡 ava auto data- 一、論文所解決的問題 實現長期記憶(大量的記憶),而且實現怎樣從長期記憶中讀取和寫入,此外還增加了推理功能 為什麽長期記憶非常重要:由於傳統的RNN連復制任務都不行,LST

論文閱讀:A Primer on Neural Network Models for Natural Language Processing(1)

選擇 works embed 負責 距離 feature 結構 tran put 前言 2017.10.2博客園的第一篇文章,Mark。 由於實驗室做的是NLP和醫療相關的內容,因此開始啃NLP這個硬骨頭,希望能學有所成。後續將關註知識圖譜,深度強化學習等內

論文Object Detection

Object Detection Rich feature hierarchies for accurate object detection and semantic segmentation CVPR’14 問題 之前最好的辦法很複雜 滑動

各種物件檢測論文總結(Object Detection )

Original url: http://blog.csdn.net/u010167269/article/details/52563573 https://handong1587.github.io/deep_learning/2015/10/09/object

論文閱讀: Anomaly Detection with Partially Observed Anomalies

對於異常檢測而言,通常是根據標籤是否可用而採取監督或者無監督的方式。論文提出一種新的方法,部分觀測到異常,針對大量未標記的資料和少量已經標記為異常的資料,提出了一種ADOA的兩階段檢測方法。首先聚類未標籤資料確信正常和可能異常。然後再用加群多分類方法來給出對應類別的置信度。

《Pelee: A Real-Time Object Detection System on Mobile Devices》解讀

已有的在移動裝置上執行的深度學習模型例如 MobileNet、 ShuffleNet 等都嚴重依賴於在深度上可分離的卷積運算,而缺乏有效的實現。在本文中,來自加拿大西安大略大學的研究者提出了稱為 PeleeNet 的有效架構,它沒有使用傳統的卷積來實現。Pele

論文閱讀:A Survey on Transfer Learning

  本文主要內容為論文《A Survey on Transfer Learning》的閱讀筆記,內容和圖片主要參考 該論文 。其中部分內容引用與部落格《遷移學習綜述a survey on transfer learning的整理下載》,感謝博主xf__ma

論文閱讀】Learning a Deep Convolutional Network for Image Super-Resolution

開發十年,就只剩下這套架構體系了! >>>   

論文閱讀筆記(二十二):Feature Pyramid Networks for Object Detection(FPN)

Feature pyramids are a basic component in recognition systems for detecting objects at different scales. But recent deep learning o

論文閱讀 | FPN:Feature Pyramid Networks for Object Detection

語義 alt bubuko 獨立 margin dual eat 方法 神經網絡 論文地址:https://arxiv.org/pdf/1612.03144v2.pdf 代碼地址:https://github.com/unsky/FPN 概述 FPN是FAIR發表在CV

論文閱讀筆記(六)Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

采樣 分享 最終 產生 pre 運算 減少 att 我們 作者:Shaoqing Ren, Kaiming He, Ross Girshick, and Jian SunSPPnet、Fast R-CNN等目標檢測算法已經大幅降低了目標檢測網絡的運行時間。可是盡管如此,仍然

【Network Architecture】Feature Pyramid Networks for Object Detection(FPN)論文解析(轉)

目錄 0. 前言 1. 部落格一 2.。 部落格二 0. 前言   這篇論文提出了一種新的特徵融合方式來解決多尺度問題, 感覺挺有創新性的, 如果需要與其他網路進行拼接,還是需要再回到原文看一下細節。這裡轉了兩篇比較好的部落格作為備忘。 1. 部落格一 這篇論文是CVPR20