Faster rcnn原始碼理解（4）

阿新 • • 發佈：2018-12-29

上一篇我們說完了AnchorTargetLayer層，然後我將Faster rcnn中的其他層看了，這裡把ROIPoolingLayer層說一下；

我先說一下它的實現原理：RPN生成的roi區域大小是對應與輸入影象大小（而且每一個roi大小都不同，因為先是禪城九種anchors，又經過迴歸，所以大小各不同），所以在ROIPoolingLayer層中，先將每一個roi區域對映到經過conv5的feature map上，然後roi對應於feature map上的這一塊區域再經過pooling操作對映到一個固定大小的區域，這裡我們用feature map_2表示，Faster rcnn中這個feature map_2的大小設為了6*6。而pooling操作就是feature map_2上的每一個點對應於feature map上roi區域上的一個部分中的最大值～具體看程式碼：

上面程式碼中的spatial_scale在Faster rcnn中為1/16（因為卷積層沒有改變大小，只有pool層改變了大小，所以1/16實際就是pool層的級聯），上面實現了setup()函式和reshape()函式，接下來就看前向傳播了：

上面程式碼中：

這一部分實現了RoiPooling中的pool操作，其實就是max操作；

最後為了理解，附上靈魂畫師的圖：

http://www.cnblogs.com/zf-blog/p/7337944.html

Faster rcnn原始碼理解（4）

上一篇我們說完了AnchorTargetLayer層，然後我將Faster rcnn中的其他層看了，這裡把ROIPoolingLayer層說一下；我先說一下它的實現原理：RPN生成的roi區域大小是對應與輸入影象大小（而且每一個roi大小都不同，因為先是禪城九種anchors，又經過迴歸，所以大

Faster rcnn原始碼理解（3）

緊接著之前的部落格，我們繼續來看faster rcnn中的AnchorTargetLayer層：該層定義在lib>rpn>中，見該層定義：首先說一下這一層的目的是輸出在特徵圖上所有點的anchors（經過二分類和迴歸）；（1）輸入blob：bottom[0]儲存特徵圖資訊

Faster rcnn原始碼理解（2）

接著上篇的部落格，咱們繼續看一下Faster RCNN的程式碼～上次大致講完了Faster rcnn在訓練時是如何獲取imdb和roidb檔案的，主要都在train_rpn()的get_roidb()函式中，train_rpn()函式後面的部分基本沒什麼需要講的了，那我們再回到訓練流程中來：

Faster rcnn原始碼理解（1）

這段時間看了不少論文，回頭看看，感覺還是有必要將Faster rcnn的原始碼理解一下，畢竟後來很多方法都和它有相近之處，同時理解該框架也有助於以後自己修改和編寫自己的框架。好的開始吧～這裡我們跟著Faster rcnn的訓練流程來一步一步梳理，進入tools\train_f

tensorflow+faster rcnn程式碼理解（四）boundingbox迴歸

1.為什麼要做Bounding-box regression？如圖所示，綠色的框為飛機的Ground Truth，紅色的框是提取的Region Proposal。那麼即便紅色的框被分類器識別為飛機，但是由於紅色的框定位不準(IoU<0.5)，那麼這張圖相當於沒有正確的檢測出飛機。如

tensorflow+faster rcnn程式碼理解（三）：損失函式構建

前面兩篇部落格已經敘述了基於vgg模型構建faster rcnn的過程： tensorflow+faster rcnn程式碼理解（一）：構建vgg前端和RPN網路 tensorflow+faster rcnn程式碼解析（二）：anchor_target_layer、proposal_targ

tensorflow+faster rcnn程式碼理解（一）：構建vgg前端和RPN網路

0.前言該程式碼執行首先就是呼叫vgg類建立一個網路物件self.net if cfg.FLAGS.network == 'vgg16': self.net = vgg16(batch_size=cfg.FLAGS.ims_per_batch) 該類位於vgg.py中，如下：

Faster RCNN程式碼理解（Python） ---訓練過程

最近開始學習深度學習，看了下Faster RCNN的程式碼，在學習的過程中也查閱了很多其他人寫的部落格，得到了很大的幫助，所以也打算把自己一些粗淺的理解記錄下來，一是記錄下自己的菜鳥學習之路，方便自己過後查閱，二來可以回饋網路。目前程式設計能力有限，且是第一次寫部落格，中間可能會有一些錯誤。目錄第一步

Faster rcnn程式碼理解（2）

接著上篇的部落格，咱們繼續看一下Faster RCNN的程式碼～上次大致講完了Faster rcnn在訓練時是如何獲取imdb和roidb檔案的，主要都在train_rpn()的get_roidb()函式中，train_rpn()函式後面的部分基本沒什麼需要講的了，那我們再回到訓練流程中來：這一步

faster rcnn原始碼解讀（六）之minibatch

原始碼： # -------------------------------------------------------- # Fast R-CNN # Copyright (c) 2015 Microsoft # Licensed under The MIT Li

pytoch faster rcnn復現系列（一） RPN層輸入輸出維度理解

目錄 1. 1*1 FC層 2. anchor_target_layer_>rpn_data &nbs

faster rcnn pytorch 系列（一）：generate_anchors原始碼解析

目錄首先，新增print，然後直接執行py檔案，生成anchor結果 1.總函式，輸入包括：特徵圖對應於原圖的大小，ratios長寬比，scales放大

Mybatis原始碼分析（4）—— Mapper的建立和獲取

Mybatis我們一般都是和Spring一起使用的，它們是怎麼融合到一起的，又各自發揮了什麼作用？就拿這個Mapper來說，我們定義了一個介面，聲明瞭一個方法，然後對應的xml寫了這個sql語句，它怎麼就執行成功了？這傢伙是怎麼實現的，帶著這個好奇心，我一步步跟蹤，慢慢揭開了它的

以太坊原始碼解讀（4）Block類及其儲存

一、Block類 type Block struct { /******header*******/ header *Header /******header*******/ /******body*********/ uncle

wifi驅動的理解（4）——usb介面在wifi模組中的角色

轉載請註明出處：http://blog.csdn.net/Righthek 謝謝！還有1天就到2017年了，回顧整個2016年至此，都沒發表過一篇技

Java原始碼系列（4）:String，StringBuilder，StringBuffer區別

hi，國慶節後第一篇。首先，祝大家國慶節快樂，然後祝大家上班快樂。既然上班了，那就知識學起來，今天咱說一下String，StringBuffer和StringBuilder的區別，這是面試必問，但是如果是工作了的小哥哥和小姐姐，就不會傻白甜的問這個問題，但咱還是要知道的，畢竟要

dubbo原始碼理解（2）消費者呼叫過程

又過了很久才敢寫。自己也在反覆看，consumer在啟動時是如何建立代理並注入的呢？在第一篇我寫了一些bean的載入過程。這個過程也是包含在啟動過程中的。 one、spring 載入dubbo檔案，開始解析consumer 配置檔案。目的就是注入。但這時候還沒有物件可以注入。只是有這個

dubbo原始碼理解（1）啟動初始化與bean載入

今天看了一些博文，都是關於dubbo原始碼解析方面的。覺得有必要記一下。問題1：spring 如何注入dubbo 的？或者說怎麼整合dubbo 的，或者說 dubbo啟動時怎麼啟動spring的？ 1、首先想要實現在spring 中發揮某框架的功能，就必須將該框架注入到springBe

Dubbo原始碼理解（3）消費者呼叫過程

小弟一直苦思 consumer 與provider 到底是怎麼通訊的呢，與是從網上找了一篇，覺得寫得很靠譜。自己就算總結，也未必有這個好，所以記錄下來！！消費者呼叫流程涉及到消費者端和生產者端的互動，所以將分為三個部分來講解，分別是 -消費者發起呼叫請求 -生產者響應呼叫請求 -消費者獲取呼叫

Java 集合深入理解（4）：List 介面

在 Java 集合深入理解：Collection 中我們熟悉了 Java 集合框架的基本概念和優點，也瞭解了根介面之一的 Collection，這篇文章來加深 Collection 的子介面之一 List 的熟悉。 List 介面一個 List 是一個元素有