Mask R-CNN論文筆記

阿新 • • 發佈：2018-12-08

背景及大致思路
a. 何凱明基於Faster R-CNN提出的用於例項分割的結構框架。該框架在原本的結構上增加了用於預測mask的新支路，速度仍達到了5fps。同時，這個結構也能用於其他的視覺任務如檢測，人物關鍵點檢測。
b. 例項分割：是物體檢測和語義分割的結合，也就是要對每個畫素都給出其對應的分類。
c. 方法的主要改變在於，在對ROI操作時，增加了一條平行的用於預測分割的支路。這條支路是一個小的全卷積網路，也就是給出畫素到畫素的結果。
d. ROI在操作時，會進行兩次取整操作，分別是對應到FeatureMap的一次和分割為k*k個bin的一次。每次取整造成的偏移，對於檢測任務可能不是很重要，但對於分割任務就不是很能接受了。針對這個問題，使用了ROIAlign來解決。
e. 作者認為，將mask和類別預測分開是很重要的。所以對於每個分類，都獨立的給出一個mask，使得類間無競爭。
f. 整個結構看起來就是FPN+Faster R-CNN+mask branch
主要模組
a. Faster R-CNN：Mask R-CNN的主幹部分及主要思想。兩步的檢測器，第一步使用RPN得到ROI的大致邊框，然後第二步使用RoIPool，得到候選區域對應的Feature Map，並作出分類和邊框迴歸。
b. Mask R-CNN：第一步也是通過RPN，得到ROI。但在第二步中，在分類和迴歸的基礎上，並行的得到一個二分類的mask。在訓練時，損失函式如下：

分別對應分類的損失，迴歸框的損失和mask的損失。在mask那一路中，我們會對於每一個類別得到一個mask，也就是說對於m * m大小的ROI，我們會得到 k * m * m個mask。但在訓練中，我們只會使用和gt一致的k的那層來計算損失。這一步和大部分的FCN網路不一樣，因為我們對於每個pixel並不是直接用softmax來預測類別，而是對於每個分類進行二分類得到最後結果。實驗顯示，這是一個很關鍵的部分。
c. Mask Representation：不同於分類和迴歸框，這一步我們不需要使用全連線層。全連線層會丟失空間資訊，也會增加引數的數量，在實驗中，不使用全連線層也讓結果更加的準確。但這就需要在進行ROI操作時，準確的對齊於原圖，因此，作者提出了接下來的方法：RoiAlign層。
d. RoIAlign：就像在第一部分所說，ROI的兩次取整操作，使得Feature Map和原圖有一定的漂移，那麼當感受野很大時，即使是一格的漂移，也會造成很大的誤差。於是，對於每一塊，我們都是算出對應的真實值，然後通過雙線性插值的方法，得到對應點的畫素值。
e. Network Architecture：作者選擇了FPN作為backbone，這裡主要發生的改變就是，根據他們的尺寸，在不同的特徵層上提取RoI。具體的各層錨框大小，選擇某一層特徵層的部分在FPN中有提及。
實現細節
a. 訓練時，只有正樣本的loss才會被計算，並保證正負樣本在1：3的比例，每張圖被縮放到800畫素的尺寸。錨框的選擇和FPN中一致。
b. 預測時，採用FPN為backbone時會給出1000個預選框，在這些框上做預測，再使用NMS，最後對預測分最高的100個框使用mask的分支。雖然對於每一個RoI都會產生k種mask，但最後只採用分類的那個結果的那層。

Mask R-CNN論文筆記

背景及大致思路 a. 何凱明基於Faster R-CNN提出的用於例項分割的結構框架。該框架在原本的結構上增加了用於預測mask的新支路，速度仍達到了5fps。同時，這個結構也能用於其他的視覺任務如檢測，人物關鍵點檢測。 b. 例項分割：是物體檢測和語義分割的結合，也就是要對每

Mask R-CNN 論文筆記

論文題目：Mask R-CNN 論文連結：論文連結論文程式碼：Facebook程式碼連結；Tensorflow版本程式碼連結； Keras and TensorFlow版本程式碼連結；MxNet版本程式碼連結一、Mask R-CNN

論文：Mask R-CNN 閱讀筆記

Mask R-CNN 目錄 Mask R-CNN 1 概述 2 模型設計 3 模型損失函式設計 4 模型的訓練細節 5 模型實驗 6 人體關鍵點檢測 7 模型的效能指標 1 概述基於Fast/Faster R-CNN、F

Fast R-CNN論文筆記

本文分兩個部分，第一個部分是論文的筆記，第二個部分是結合程式碼來看fast-RCNN。論文部分：主要是為了對RCNN，SPPnet的效果上的改進，下面簡述了一些RCNN的缺點： Training is a multi-stage pipeline Training

[Network Architecture]Mask R-CNN論文解析（轉）

前言最近有一個idea需要去驗證，比較忙，看完Mask R-CNN論文了，最近會去研究Mask R-CNN的程式碼，論文解析轉載網上的兩篇部落格技術挖掘者 remanented 文章1 論文題目：Mask R-CNN 論文連結：論文連結論文程式碼：Facebook程式

Mask R-CNN論文導讀

看到文章出來的第一個感覺就是，哇塞，大神們不光甩大招，還在一起甩~~~讓我們這些小蝦米們怎麼玩呢~廢話不多說，介紹重點。一、文章思想文章的主要思路就是把原有的Faster-RCNN進行擴充套件，新增一個分支使用現有的檢測對目標進行並行預測。同時，這個

Region-based Convolutional Networks for Accurate Object Detection and Segmentation----R-CNN論文筆記

一、為什麼提出R-CNN 目標檢測效能停滯不前，效能最好的整合方法又太複雜，所以作者提出了一個既能大幅提升效能，又更簡單的R-CNN。二、R-CNN的框架上面的框架圖清晰的給出了R-CNN的目標檢測流程： 1) 輸入測試影象 2) 利用s

R-CNN論文詳解（學習筆記）

R-CNN:基於候選區域的目標檢測 Region proposals 基本概念(看論文前需要掌握的)： 1.cnn(卷積神經網路):CNN從入門到精通（初學者） 2.Selective search:選擇性搜素 3.warp:圖形region變換 4.Supervised pre-t

【論文翻譯】Mask R-CNN

Mask R-CNN Kaiming He Georgia Gkioxari Piotr Dolla ́r Facebook AI Research (FAIR) Ross Girshick 摘要我們提出了一個概念上簡單，靈活和通用的目標分割框架。我們

目標檢測定位與分割論文閱讀心得總結：FCN U-Net R-CNN FR-CNN Faster R-CNN Mask R-CNN

目前，基於區域的方法主要分為兩類：任務解耦和的RCNN[1]和任務高度耦合的FCN[2]。 RCNN是將任務分解，目標檢測、定位與分割依次逐一進行，前者決定後者的輸入，因此稱為任務解耦和。而

Tensorflow實現Mask R-CNN實例分割通用框架，檢測，分割和特征點定位一次搞定（多圖）

優點設計 orf 時間 rcnn 超越 rain 沒有 add Mask R-CNN實例分割通用框架，檢測，分割和特征點定位一次搞定（多圖）導語：Mask R-CNN是Faster R-CNN的擴展形式，能夠有效地檢測圖像中的目標，同時還能為每個實例生成一個

R-CNN閱讀筆記

bsp search 地址 .com ++ style 輸入產生 obj 論文地址：《Rich feature hierarchies for accurate object detection and semantic segmentation》論文包含兩個關鍵：（

【目標檢測】Cascade R-CNN 論文解析

都是 org 檢測 rpn 很多 .org 實驗 bubuko pro 目錄 0. 論文鏈接 1. 概述 @ 0. 論文鏈接 Cascade R-CNN 1. 概述 ??這是CVPR 2018的一篇文章，這篇文章也為我之前讀R-CNN系列困擾的一個問題提供了一個解決方案

【Mask RCNN】《Mask R-CNN》

ICCV-2017 目錄目錄 1 Motivation 2 Innovation 3 Advantages 4 Methods

目標檢測演算法理解：從R-CNN到Mask R-CNN

　　因為工作了以後時間比較瑣碎，所以更多的時候使用onenote記錄知識點，但是對於一些演算法層面的東西，個人的理解畢竟是有侷限的。我一直做的都是影象分類方向，最近開始接觸了目標檢測，也看了一些大牛的論文，雖然網上已經有很多相關的演算法講解，但是每個人對同一個問題的理解都不太一樣，本文主

先理解Mask R-CNN的工作原理，然後構建顏色填充器應用

程式碼（包括作者構建的資料集和已訓練的模型）：https://github.com/matterport/Mask_RCNN/tree/master/samples/balloon 什麼是例項分割？例項分割是一種在畫素層面識別目標輪廓的任務

Faster R-CNN論文及原始碼解讀

R-CNN是目標檢測領域中十分經典的方法，相比於傳統的手工特徵，R-CNN將卷積神經網路引入，用於提取深度特徵，後接一個分類器判決搜尋區域是否包含目標及其置信度，取得了較為準確的檢測結果。Fast R-CNN和Faster R-CNN是R-CNN的升級版本，在準確率和實時性方面都得到了較大提升。在F

Fast R-CNN論文學習

R-CNN論文學習 Abstract 1. Introduction 1.1 R-CNN 和 SPPnet R-CNN的問題 SPPnet的改進和問題 1.2 本論文的貢獻

Faster R-CNN 論文學習

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 演算法簡介 Abstract 1. Introduction 2. Relat

使用Mask R-CNN訓練自己的資料

在使用Mask R-CNN訓練自己的資料時，需要提前瞭解Mask R-CNN的標註工具以及跑通Mask R-CNN的Demo。下面的兩篇部落格分別介紹了Mask R-CNN標註工具以及如何跑通Mask R-CNN的Demo。 Mask RCNN標註工具使用Keras與Tensorflo

Mask R-CNN論文筆記

相關推薦