「Computer Vision」Notes on Hypercolumns
QQ Group: 428014259
Sina Weibo:小鋒子Shawn
Tencent E-mail:[email protected]
http://blog.csdn.net/dgyuanshaofeng/article/details/83904764
閱讀的是PAMI版本。
作者:Bharath Hariharan, Pablo Arbelaez, Ross Girshick, and Jitendra Malik
單位: University of California Berkeley, Microsoft Research
0 摘要
深層語義資訊在精確定位上是不夠的,而淺層統計資訊則提供了幫助。這也是U-Net、FCN所揭示的。提出超列(hypercolumn),指一個輸入畫素位置往後的所有對應位置的卷積網路單元啟用值,組成一列向量。
1 介紹
超列,借鑑於神經科學,其區別在於不僅僅指邊緣檢測器,還包含更多具有語義資訊的神經單元。超列的idea,如圖1所示。
2 背景
2.1 物體例項分割
2.2 用於物體檢測和分割的ConvNet
提及R-CNN
3 相關工作
4 利用超列進行畫素分類
超列的計算,十分簡單。取得一個檢測框(可能是正方形),resize到分類網路的固定輸入大小(分類網路使用了全連線層),resized影象分塊進入分類網路,把各個層的特徵圖進行bilinear插值,恢復到影象分塊大小,取得各個層的對應位置的超列(級聯多通道啟用值)。
神經網路表示超列分類器,如圖2所示。
[1] Hypercolumns for Object Segmentation and Fine-grained Localization CVPR 2015 [paper] [code]
[2] Object Instance Segmentation and Fine-Grained Localization Using Hypercolumns IEEE TPAMI 2017 [paper]