《Context Contrasted Feature and Gated Multi-Scale Aggregation for Scene Segmentation》論文閱讀

阿新 • • 發佈：2018-11-24

動機

第一個工作的動機，（context contrasted local (CCL) model ）
- 作者認為獲得有判別力的語義特徵以及多尺度融合是提升效能的關鍵；
- 上下文通常具有平滑的表示，並且由顯著物件的特徵支配，這對於標記不顯眼的物件和東西是有害的。
- 用於場景分割的更好的特徵是有區別的情境感知區域性特徵，即，在知道上下文資訊的同時，畫素位置p的特徵將不被影象的其他部分支配。
第二個工作的動機（門控和）
- 由於場景分割中物體的巨大尺度變化，基於單個尺度特徵對所有單個畫素進行分類是不合理的。

貢獻

我們提出了一種新的上下文對比區域性特徵，其被定製用於場景分割並且提出上下文對比區域性（CCL）模型以獲得多尺度和多級上下文對比的區域性特徵。
我們進一步提出了一個門控和，以選擇性地聚合每個空間位置的適當比例特徵，這是解決多尺度物件存在問題的有效且有效的方法。

方法

網路架構

整體架構

1. Context Contrasted Local Feature （CCL）
- 由於場景分割中物件和內容的複雜性，不加選擇地收集上下文資訊會帶來有害的噪聲，尤其是在雜亂的環境中。
融合上下文資訊和區域性細節：

1541566988317

網路結構

1541567186032

實驗效果

1541567544263

2. Gated Multi-scale Aggregation

網路結構

1541568486913

RNN：因此，所有資訊圖依次被送到RNN以學習這些資訊圖的關係。基於RNN，這些資訊圖可以知道鄰域地圖並獲取所有資訊地圖之間的序列關係；我們假設高層特徵學習了良好的低層特徵，所以我們從高層特徵開始，

1541569220386

生成的gate

1541569376848

gate融合結果：

1541569445967

門控制著跳躍層資訊的流動，

1541569726437

sum V.S. gated sum
- sum預設每個特徵圖都是權值為1，sum融合不考慮不同輸入的個體特徵，並且只能不加區分地融合所有輸入。
- gated sum：通過其固有的門選擇性地聚合每個位置解析的適當得分圖。門Gn p調整其值以適應測試輸入特徵以控制跳過層的資訊流。

實驗

CCL對於不顯著目標的效果

1541570403986

《Context Contrasted Feature and Gated Multi-Scale Aggregation for Scene Segmentation》論文閱讀

動機第一個工作的動機，（context contrasted local (CCL) model ）作者認為獲得有判別力的語義特徵以及多尺度融合是提升效能的關鍵；上下文通常具有平滑的表示，並且由顯著物件的特徵支配，這對於標記不顯眼的物件和東西是

Path Aggregation Network for Instance Segmentation 論文閱讀

寫在最前面：最近兩個周心情浮躁，偶爾讀了讀，所以僅是翻譯，未提出自己的問題。這篇文章是例項分割方向文獻，Mask R-CNN的改進。其中參考了很多大佬的現有的理解，可能參考的東西太多，有疏漏。提示：排版對手機不友好。原文地址：Path Aggregation Network fo

Feed Forward and Backward Run in Deep Convolution Neural Network 論文閱讀筆記

徒手實現CNN：綜述論文詳解卷積網路的數學本質 Abstract 對卷積網路的數學本質和過程仍然不是太清楚，這也就是本論文的目的。我們使用灰度圖作為輸入資訊影象， ReLU 和 Sigmoid 啟用函式構建卷積網路的非線性屬性，交叉熵損失函式用於計算

PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metric Space 論文閱讀與實現

文章大意：本文主要面向空間點集的分類及語義分割問題，下面的討論與實現以語義分割為例進行介紹。下面是要解決的問題的示意圖：常見的2D語義分割問題一般的資料格式可能是語義邊界——如Polygon Annotation(多邊形（P

論文閱讀筆記二十：MULTI-SCALE CONTEXT AGGREGATION BY DILATED CONVOLUTIONS（ICRL2016）

論文源址：https://arxiv.org/abs/1511.07122 tensorflow Github:https://github.com/ndrplz/dilation-tensorflow 摘要該文提出了空洞卷積模型，在不降低解析

論文閱讀筆記《Gated Context Aggregation Network for Image Dehazing and Deraining》WACV19

輸出每一個為什麽作用導致作者 ont 而不是簡單的目錄：相關鏈接方法亮點方法細節實驗結果總結與收獲相關鏈接：論文：https://arxiv.org/abs/1811.08747 源碼：暫無方法亮點：提出端到端的去霧網絡，不

Multi-Scale Context Aggregation by Dilated Convolution訓練記錄

讀完文章後，覺得應該網路框架類似FCN，卻可以達到更好的效果。該網路的準確度和花費時間都應該好於FCN-8S，打算funetune一個自己的模型。首先從測試開始，對於predict.py，我認真研究了他的程式碼，我來具體說一下他的程式碼結構：首先讀入圖片後，得到deplo

膨脹卷積——《MULTI-SCALE CONTEXT AGGREGATION BY DILATED CONVOLUTIONS》

看這篇論文主要是想了解膨脹卷積，搜出這篇，看起來貌似比deeplab簡單一些，於是以此入手。這篇論文把膨脹卷積的計算原理講的很清楚，但是作用和產生的緣由的話還是deeplab的論文更容易懂，deeplab裡面叫"hole algorithm"。 1. dense predi

《DARK IMAGE ENHANCEMENT BASED ON PAIRWISE TARGET CONTRAST AND MULTI-SCALE DETAIL BOOSTING》 C++復現

論文連結請google，一篇IEEE的論文，在查詢提升影象細節的時候看到一個部落格上對這個論文介紹，我下載不了論文，所幸那個博主給了論文的主要部分的圖片，可以到這個部落格檢視：https://blog.csdn.net/q781045982/article/details/7863

Edge-Preserving Decompositions for Multi-Scale Tone and Detail Manipulation

Abstract: Many recent computational photography techniques decompose an image into a piecewise smooth base layer, containing large scale variations in int

Multi-Scale Guided Concurrent Reflection Removal Network

gradient inference network(GiN):輸入是4通道張量，它是輸入混合影象及其對應梯度的組合. The image inference network (IiN):以混合影象為輸入，提取描述全域性結構和高層語義資訊的背景特徵表示來估計B和R。 GIN

論文閱讀 | Multi-Cast Attention Networks for Retrieval-based Question Answering and Response Prediction

Multi-Cast Attention Networks for Retrieval-based Question Answering and Response Prediction （KDD 2018） 1.主要特點：通常，一個句子應用一次attention，然後學習最終表

Fully-adaptive Feature Sharing in Multi-Task Networks with Applications in Person Attribute Classifi

Fully-adaptive Feature Sharing in Multi-Task Networks with Applications in Person Attribute Classification (多工網路中的完全自適應特徵共享及其在人屬性分類中的應用 ) 原文連結：Fully

論文筆記 — MatchNet: Unifying Feature and Metric Learning for Patch-Based Matching

　　論文：https://github.com/ei1994/my_reference_library/tree/master/papers 　　本文的貢獻點如下：　　1. 提出了一個新的利用深度網路架構基於patch的匹配來明顯的改善了效果；　　2. 利用更少的描述符，得到了比state-of-t