tensorflow+faster rcnn程式碼理解（三）：損失函式構建

阿新 • • 發佈：2018-12-15

前面兩篇部落格已經敘述了基於vgg模型構建faster rcnn的過程：

tensorflow+faster rcnn程式碼理解（一）：構建vgg前端和RPN網路

tensorflow+faster rcnn程式碼解析（二）：anchor_target_layer、proposal_target_layer、proposal_layer

faster rcnn的Loss分為4部分：

1. RPN class loss

構成RPN分類損失的輸入如下，採用softmaxloss：

rpn_cls_score_reshape：訓練過程中anchor預測為前景或者背景的分數

rpn_label：anchor被標註的類別，前景or背景

# RPN, class loss
rpn_cls_score = tf.reshape(self._predictions['rpn_cls_score_reshape'], [-1, 2]) #rpn_cls_score = （17100,2）
rpn_label = tf.reshape(self._anchor_targets['rpn_labels'], [-1])  #rpn_label = (17100,)
rpn_select = tf.where(tf.not_equal(rpn_label, -1)) #將不等於-1的labels選出來（也就是正負樣本選出來）,返回序號
rpn_cls_score = tf.reshape(tf.gather(rpn_cls_score, rpn_select), [-1, 2]) #同時選出對應的分數
rpn_label = tf.reshape(tf.gather(rpn_label, rpn_select), [-1]) #選出對應的label
rpn_cross_entropy = tf.reduce_mean(
                    tf.nn.sparse_softmax_cross_entropy_with_logits(logits=rpn_cls_score, labels=rpn_label))

2. RPN bbox loss

構成RPNbbox迴歸損失的輸入如下，採用SmoothL1Loss：

rpn_bbox_pred：訓練過程中預測的anchor偏移量
rpn_bbox_targets：anchor與gt實際的偏移量
rpn_bbox_inside_weights：anchor內權重
rpn_bbox_outside_weights：anchor外權重

# RPN, bbox loss
rpn_bbox_pred = self._predictions['rpn_bbox_pred']
rpn_bbox_targets = self._anchor_targets['rpn_bbox_targets']
rpn_bbox_inside_weights = self._anchor_targets['rpn_bbox_inside_weights']
rpn_bbox_outside_weights = self._anchor_targets['rpn_bbox_outside_weights']

rpn_loss_box = self._smooth_l1_loss(rpn_bbox_pred, rpn_bbox_targets, rpn_bbox_inside_weights,
rpn_bbox_outside_weights, sigma=sigma_rpn, dim=[1, 2, 3])

3. RCNN class loss

構成RCNN分類損失的輸入如下，採用softmaxloss：

cls_score：訓練過程中fast rcnn部分rois被預測的類別
labels：rois被標註的類別，屬於哪一類

# RCNN, class loss
cls_score = self._predictions["cls_score"]
label = tf.reshape(self._proposal_targets["labels"], [-1])

cross_entropy = tf.reduce_mean(tf.nn.sparse_softmax_cross_entropy_with_logits(
                logits=tf.reshape(cls_score, [-1, self._num_classes]), labels=label))

4 RCNN bbox loss

構成RCNNbbox迴歸損失的輸入如下，採用SmoothL1Loss：

bbox_pred：訓練過程中fast rcnn部分rois預測的偏移量
bbox_targets：rois與gt實際的偏移量
bbox_inside_weights：rois內權重
bbox_outside_weights：rois外權重

# RCNN, bbox loss
bbox_pred = self._predictions['bbox_pred'] #(128,12)
bbox_targets = self._proposal_targets['bbox_targets'] #(128,12)
bbox_inside_weights = self._proposal_targets['bbox_inside_weights']#(128,12)
bbox_outside_weights = self._proposal_targets['bbox_outside_weights']#(128,12)

loss_box = self._smooth_l1_loss(bbox_pred, bbox_targets, bbox_inside_weights, bbox_outside_weights)

tensorflow+faster rcnn程式碼理解（三）：損失函式構建

前面兩篇部落格已經敘述了基於vgg模型構建faster rcnn的過程： tensorflow+faster rcnn程式碼理解（一）：構建vgg前端和RPN網路 tensorflow+faster rcnn程式碼解析（二）：anchor_target_layer、proposal_targ

tensorflow+faster rcnn程式碼理解（一）：構建vgg前端和RPN網路

0.前言該程式碼執行首先就是呼叫vgg類建立一個網路物件self.net if cfg.FLAGS.network == 'vgg16': self.net = vgg16(batch_size=cfg.FLAGS.ims_per_batch) 該類位於vgg.py中，如下：

tensorflow+faster rcnn程式碼理解（四）boundingbox迴歸

1.為什麼要做Bounding-box regression？如圖所示，綠色的框為飛機的Ground Truth，紅色的框是提取的Region Proposal。那麼即便紅色的框被分類器識別為飛機，但是由於紅色的框定位不準(IoU<0.5)，那麼這張圖相當於沒有正確的檢測出飛機。如

tensorflow+faster rcnn程式碼解析（二）：anchor_target_layer、proposal_target_layer、proposal_layer

接在tensorflow+faster rcnn程式碼理解（一）：構建vgg前端和RPN網路之後，對於每張輸入影象（600×800）RPN會產生17100個anchor，構建RPN後會輸出4個tensor，維度如下： rpn_cls_prob：（1,38,50,18） rpn_bbo

Faster RCNN程式碼理解（Python） ---訓練過程

最近開始學習深度學習，看了下Faster RCNN的程式碼，在學習的過程中也查閱了很多其他人寫的部落格，得到了很大的幫助，所以也打算把自己一些粗淺的理解記錄下來，一是記錄下自己的菜鳥學習之路，方便自己過後查閱，二來可以回饋網路。目前程式設計能力有限，且是第一次寫部落格，中間可能會有一些錯誤。目錄第一步

Faster rcnn程式碼理解（2）

接著上篇的部落格，咱們繼續看一下Faster RCNN的程式碼～上次大致講完了Faster rcnn在訓練時是如何獲取imdb和roidb檔案的，主要都在train_rpn()的get_roidb()函式中，train_rpn()函式後面的部分基本沒什麼需要講的了，那我們再回到訓練流程中來：這一步

detectron程式碼理解（三）：RPN構建與相應的損失函式

1.RPN的構建對RPN的構建在FPN.py的add_fpn_rpn_output函式中 def add_fpn_rpn_outputs(model, blobs_in, dim_in, spatial_scales): """Add RPN on FPN specific out

detectron程式碼理解（一）：Resnet模型構建理解

這裡具體以resnet50為例進行說明，一句一句地分析程式碼，程式碼位置位於Resnet.py，具體的分析函式為add_ResNet_convX_body. 在分析之前首先貼上resnet50的程式碼結構圖： # add the stem (by default, conv1 and

detectron程式碼理解（二）：FPN模型構建

1.FPN的原理 FPN的原理示意圖如下，上述包括一個自底向上的線路，一個自頂向下的線路，橫向連線（lateral connection），圖中放大的區域就是橫向連線。自底向上的路徑：自下而上的路徑是卷積網路的前饋計算，在前向過程中，feature map的大小在經過某些層後會改變，

tensorflow學習筆記（三）：損失函式

tf.python.ops.nn_ops.sparse_softmax_cross_entropy_with_logits(logits, labels, name=None) def sparse_softmax_cross_entropy_with_l

Faster rcnn原始碼理解（4）

上一篇我們說完了AnchorTargetLayer層，然後我將Faster rcnn中的其他層看了，這裡把ROIPoolingLayer層說一下；我先說一下它的實現原理：RPN生成的roi區域大小是對應與輸入影象大小（而且每一個roi大小都不同，因為先是禪城九種anchors，又經過迴歸，所以大

Faster rcnn原始碼理解（3）

緊接著之前的部落格，我們繼續來看faster rcnn中的AnchorTargetLayer層：該層定義在lib>rpn>中，見該層定義：首先說一下這一層的目的是輸出在特徵圖上所有點的anchors（經過二分類和迴歸）；（1）輸入blob：bottom[0]儲存特徵圖資訊

Faster rcnn原始碼理解（2）

接著上篇的部落格，咱們繼續看一下Faster RCNN的程式碼～上次大致講完了Faster rcnn在訓練時是如何獲取imdb和roidb檔案的，主要都在train_rpn()的get_roidb()函式中，train_rpn()函式後面的部分基本沒什麼需要講的了，那我們再回到訓練流程中來：

Faster rcnn原始碼理解（1）

這段時間看了不少論文，回頭看看，感覺還是有必要將Faster rcnn的原始碼理解一下，畢竟後來很多方法都和它有相近之處，同時理解該框架也有助於以後自己修改和編寫自己的框架。好的開始吧～這裡我們跟著Faster rcnn的訓練流程來一步一步梳理，進入tools\train_f

Java常用的八種排序演算法與程式碼實現（三）：桶排序、計數排序、基數排序

三種線性排序演算法：桶排序、計數排序、基數排序線性排序演算法（Linear Sort）：這些排序演算法的時間複雜度是線性的O(n)，是非比較的排序演算法桶排序（Bucket Sort）　　將要排序的資料分到幾個有序的桶裡，每個桶裡的資料再單獨進行排序，桶內排完序之後，再把桶裡的

TensorFlow從入門到理解（四）：你的第一個迴圈神經網路RNN（分類例子）

執行程式碼： import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data # set random seed for comparing the two result calculations

TensorFlow從入門到理解（五）：你的第一個迴圈神經網路RNN（迴歸例子）

執行程式碼： import tensorflow as tf import numpy as np import matplotlib.pyplot as plt BATCH_START = 0 TIME_STEPS = 20 BATCH_SIZE = 50 INPUT_SIZE = 1 OUTP

【AI實戰】快速掌握TensorFlow（三）：激勵函式

到現在我們已經瞭解了TensorFlow的特點和基本操作（見文章：快速掌握TensorFlow（一）），以及TensorFlow計算圖、會話的操作（見文章：快速掌握TensorFlow（二）），接下來我們將繼續學習掌握TensorFlow。本文主要是學習掌握TensorFlow的激勵函式

detectron程式碼理解（四）：generate_anchors

def generate_anchors( stride=16, sizes=(32, 64, 128, 256, 512), aspect_ratios=(0.5, 1, 2) ): """Generates a matrix of anchor boxes in (x1, y1,

Gradle 理解（三）：Task

task在gradle佔有很重要的地位，因為在gradle中任何執行操作都是通過task來執行。task可以理解成任務，作用就是執行某些指定的操作。以Android為例，Gradle構建編譯一個Android專案的時候，需要執行很多操作流程。整個過程可以通過命令列gradle asse

tensorflow+faster rcnn程式碼理解（三）：損失函式構建

1. RPN class loss

2. RPN bbox loss

3. RCNN class loss

4 RCNN bbox loss

相關推薦