[深度學習論文筆記][CVPR 18]Path Aggregation Network for Instance Segmentation

阿新 • • 發佈：2019-01-31

[CVPR 18]Path Aggregation Network for Instance Segmentation

Shu Liu, Lu Qi, Haifang Qin, Jianping Shi and Jiaya Jia

from

CUHK, Peking University, Sensetime & YouTu Lab

Motivation

本文提出了名為PANet的網路結構，用於物體檢測(object detection)和例項分割(instance segmentation)任務。該網路基於FPN[1]和Mask RCNN[2]模型之上提出了三點創新，顯著地提升了模型在物體檢測和例項分割網路上的效能：

PANet改進了主幹網路結構，加強了特徵金字塔的結構，縮短了高低層特徵融合的路徑；
提出了更靈活的RoI池化。之前FPN的RoI池化只從高層特徵取值，現在則在各個尺度上的特徵裡操作；
預測mask的時候使用一個額外的fc支路來輔助全卷積分割支路的結果。

網路的結構圖如下所示，三個創新點對應的結構變化已經在圖中標出：

這裡寫圖片描述

PANet在COCO 17例項分割競賽中取得了第一名的成績，在檢測任務中取得了第二的成績。

Method

Bottom-up Path Augmentation

FPN的網路結構如下圖所示：

這裡寫圖片描述

PANet的主幹網路與FPN不同之處在於新構建的N2~N5卷積。從Ni層到Ni+1層的細節結構如下圖所示，其中的融合操作是逐畫素加和：

這裡寫圖片描述

構建該新支路的優勢在於縮短了底層尺寸大的特徵到高層尺寸小的特徵之間的距離，讓特徵融合更加有效。其變化可以參考網路結構圖中紅色（原FPN特徵融合路徑）和綠色（PANet特徵融合路徑）虛線。綠色虛線所跨越的卷積層會更少。

Adaptive Feature Pooling

在FPN中，作者根據RoI的尺寸大小來決定在P2~P5的某個層上取特徵，且尺寸越大所操作的特徵越高，如下圖所示：

這裡寫圖片描述

這篇文章的作者認為高低層特徵各有其優勢。高層特徵的視野域更大，小的RoI可以在這些特徵上獲取更豐富的上下文資訊。低層特徵可以幫助大的proposal更好地定位。這裡提出的池化方法則是在所有尺度的特徵上操作，之後進行融合，如下圖所示：

這裡寫圖片描述

Fully-connected Fusion

作者認為全連線層與全卷積的網路相比能更好地獲取尺度更大的資訊，有助於區分兩個不同的例項或者一個例項的不同部位。其本質是全連線層是卷積核更大的卷積操作，因此能獲得更大的視野域。

在實現過程中，作者將RoI操作結果拉伸到28x28的尺寸，之後使用全連線操作得到784x1x1的前背景二分類結果，其中784=28x28。將該分割結果與全卷積得到的分割結果融合，即得到最終的分割結果。

Experiments

COCO

PANet在COCO 2016資料集上的例項分割和物體檢測效能如下所示，其中ms-train指的是使用多尺度的輸入影象進行訓練：

這裡寫圖片描述

同時在COCO資料庫上作者也做了相近的對比試驗，以驗證各個模組的有效性：

這裡寫圖片描述

Cityscapes & MVD

作者在Cityscapes和MVD資料庫上也測試了例項分割的效能，都有不錯的效果。結果如下圖所示，其中test tricks指的是測試階段使用所尺度圖片、圖片翻轉、mask投票和box投票等：

這裡寫圖片描述

Reference

[1] T. Lin, P. Dollar, R. B. Girshick, K. He, B. Hariharan, and S. J. Belongie. Feature pyramid networks for object detection. In CVPR, 2017.

[2] K. He, G. Gkioxari, P. Dollar, and R. B. Girshick. Mask R-CNN. In ICCV, 2017.

[深度學習論文筆記][CVPR 18]Path Aggregation Network for Instance Segmentation

[CVPR 18]Path Aggregation Network for Instance Segmentation Shu Liu, Lu Qi, Haifang Qin, Jianping Shi and Jiaya Jia from CUHK, P

Path Aggregation Network for Instance Segmentation 論文閱讀

寫在最前面：最近兩個周心情浮躁，偶爾讀了讀，所以僅是翻譯，未提出自己的問題。這篇文章是例項分割方向文獻，Mask R-CNN的改進。其中參考了很多大佬的現有的理解，可能參考的東西太多，有疏漏。提示：排版對手機不友好。原文地址：Path Aggregation Network fo

[深度學習論文筆記][AAAI 18]Accelerated Training for Massive Classification via Dynamic Class Selection

[AAAI 18] Accelerated Training for Massive Classification via Dynamic Class Selection Xingcheng Zhang, Lei Yang, Junjie Yan, Dahua

深度學習論文筆記：Deep Residual Networks with Dynamically Weighted Wavelet Coefficients for Fault Diagnosis of Planetary Gearboxes

這篇文章將深度學習演算法應用於機械故障診斷，採用了“小波包分解+深度殘差網路(ResNet)”的思路，將機械振動訊號按照故障型別進行分類。文章的核心創新點：複雜旋轉機械系統的振動訊號包含著很多不同頻率的衝擊和振盪成分，而且不同頻帶內的振動成分在故障診斷中的重要程度經常是不同的，因此可以按照如下步驟設計深度

【深度學習論文筆記】Deep Neural Networks for Object Detection

論文:<<Deep Neural Networks for Object Detection>> 作者:Christian Szegedy Al

[深度學習論文筆記][總結]Invariant gait feature extraction based on image transformation

近期有兩篇來自於同一第一作者單位的工作，使用基於神經網路的影象變換模型來處理不同視角、不同衣著或手持物的CEI特徵到統一的90°正常特徵(SPAE與GaitGAN)。在這裡加以簡單總結與對比。 [Neurocomputing 17] Invariant fea

[深度學習論文筆記][Image Classification] 影象分類部分論文導讀

[ImageNet] • Over 15M labeled high resolution images. • Roughly 22k categories.• Collected from web and labeled by Amazon Mechanical Turk

[深度學習論文筆記][Visualizing] 網路視覺化部分論文導讀

There are several ways to understanding and visualing CNN 1 Visualizing Activations Show the activations of the network during the forwar

[深度學習論文筆記] Convolutional Neuron Networks and its Applications

In artificial intelligence, there exists a Moravec’s Paradox, 1 “High-level reasoning requires very little computation, but low-level sen

[深度學習論文筆記][arxiv 1804]ExFuse: Enhancing Feature Fusion for Semantic Segmentation

[arxiv 1804]ExFuse: Enhancing Feature Fusion for Semantic Segmentation Zhenli Zhang, Xiangyu Zhang, Chao Peng, Dazhi Cheng, Jian S

深度學習論文筆記（六）--- FCN-2015年（Fully Convolutional Networks for Semantic Segmentation）

深度學習論文筆記（六）--- FCN 全連線網路 FullyConvolutional Networks for Semantic Segmentation Author：J Long ， E Shelhamer， T Darrell Year： 2015 1、導

論文閱讀筆記《Gated Context Aggregation Network for Image Dehazing and Deraining》WACV19

輸出每一個為什麽作用導致作者 ont 而不是簡單的目錄：相關鏈接方法亮點方法細節實驗結果總結與收獲相關鏈接：論文：https://arxiv.org/abs/1811.08747 源碼：暫無方法亮點：提出端到端的去霧網絡，不

Andrew Ng 深度學習課程deeplearning.ai 程式設計作業——shallow network for datesets classification (1-3)

##Planar data classification with one hidden layer ## 1.常用的Python Library numpy：is the fundamental package for scientific computin

[深度學習論文閱讀]Facenet論文閱讀筆記（包括GoogLenet引數計算方式）

1 統述功能：face verification (is this the same person) recognition (who is this person) clustering (find common people among

深度學習論文閱讀筆記（三）之深度信念網路DBN

想要獲得更多深度學習在NLP方面應用的經典論文、實踐經驗和最新訊息，歡迎關注微信公眾號“DeepLearning_NLP” 或者掃描下方二維碼新增關注。深度神經網路 12.《受限波爾茲曼機簡介》（1）主要內容：主要介紹受限玻爾茲曼機（RBM）的基本模型、學習

【神經網絡和深度學習】筆記 - 第二章反向傳播算法

討論固定特征 array sed 並不會思想隨機梯度相關上一章中我們遺留了一個問題，就是在神經網絡的學習過程中，在更新參數的時候，如何去計算損失函數關於參數的梯度。這一章，我們將會學到一種快速的計算梯度的算法：反向傳播算法。這一章相較於後面的章節涉及到的數學

吳恩達-深度學習-課程筆記-3: Python和向量化( Week 2 )

有時指數檢查都是效果很快 -1 tro str 1 向量化( Vectorization ) 在邏輯回歸中，以計算z為例，z = w的轉置和x進行內積運算再加上b，你可以用for循環來實現。但是在python中z可以調用numpy的方法，直接一句z = np.d

吳恩達-深度學習-課程筆記-6: 深度學習的實用層面( Week 1 )

data 絕對值 initial 均值化 http 梯度下降法 ati lod 表示 1 訓練/驗證/測試集( Train/Dev/test sets ) 構建神經網絡的時候有些參數需要選擇，比如層數，單元數，學習率，激活函數。這些參數可以通過在驗證集上的表現好壞來進行選擇

吳恩達-深度學習-課程筆記-8: 超參數調試、Batch正則化和softmax( Week 3 )

erp 搜索給定 via 深度 mode any .com sim 1 調試處理( tuning process ) 如下圖所示，ng認為學習速率α是需要調試的最重要的超參數。其次重要的是momentum算法的β參數（一般設為0.9），隱藏單元數和mini-batch的

《Andrew Ng深度學習》筆記1

優化時代信息自變量明顯如果特殊結果數據表深度學習概論 1.什麽是神經網絡？ 2.用神經網絡來監督學習 3.為什麽神經網絡會火起來？ 1.什麽是神經網絡？深度學習指的是訓練神經網絡。通俗的話，就是通過對數據的分析與計算發現自變量與因變量的映射關系(神

[深度學習論文筆記][CVPR 18]Path Aggregation Network for Instance Segmentation

[CVPR 18]Path Aggregation Network for Instance Segmentation

Motivation

Method

Bottom-up Path Augmentation

Adaptive Feature Pooling

Fully-connected Fusion

Experiments

COCO

Cityscapes & MVD

Reference

相關推薦