《Context Contrasted Feature and Gated Multi-Scale Aggregation for Scene Segmentation》論文閱讀
阿新 • • 發佈:2018-11-24
動機
- 第一個工作的動機,(context contrasted local (CCL) model )
- 作者認為獲得有判別力的語義特徵以及多尺度融合是提升效能的關鍵;
- 上下文通常具有平滑的表示,並且由顯著物件的特徵支配,這對於標記不顯眼的物件和東西是有害的。
- 用於場景分割的更好的特徵是有區別的情境感知區域性特徵,即,在知道上下文資訊的同時,畫素位置p的特徵將不被影象的其他部分支配。
- 第二個工作的動機(門控和)
- 由於場景分割中物體的巨大尺度變化,基於單個尺度特徵對所有單個畫素進行分類是不合理的。
貢獻
- 我們提出了一種新的上下文對比區域性特徵,其被定製用於場景分割並且提出上下文對比區域性(CCL)模型以獲得多尺度和多級上下文對比的區域性特徵。
- 我們進一步提出了一個門控和,以選擇性地聚合每個空間位置的適當比例特徵,這是解決多尺度物件存在問題的有效且有效的方法。
方法
網路架構
-
整體架構
1. Context Contrasted Local Feature (CCL)
- 由於場景分割中物件和內容的複雜性,不加選擇地收集上下文資訊會帶來有害的噪聲,尤其是在雜亂的環境中。
-
融合上下文資訊和區域性細節:
- 網路結構
- 實驗效果
2. Gated Multi-scale Aggregation
- 網路結構
- RNN: 因此,所有資訊圖依次被送到RNN以學習這些資訊圖的關係。基於RNN,這些資訊圖可以知道鄰域地圖並獲取所有資訊地圖之間的序列關係;我們假設高層特徵學習了良好的低層特徵,所以我們從高層特徵開始,
- 生成的gate
- gate融合結果:
- 門控制著跳躍層資訊的流動,
- sum V.S. gated sum
- sum預設每個特徵圖都是權值為1,sum融合不考慮不同輸入的個體特徵,並且只能不加區分地融合所有輸入。
- gated sum:通過其固有的門選擇性地聚合每個位置解析的適當得分圖。門Gn p調整其值以適應測試輸入特徵以控制跳過層的資訊流。
實驗
- CCL對於不顯著目標的效果