1. 程式人生 > >Residual Attention Network for Image Classification, cvpr17

Residual Attention Network for Image Classification, cvpr17

人至懶則無敵。

cvpr17的論文,很有意思,值得一讀和復現。(筆者懶,還是坐等開源吧)

還是老樣子,看圖說話,具體細節,請看論文。


圖1說明了越high-level的part feature及其mask越會focus在object或者parts of object上。而且通過mask,可以diminish不相關的區域,如背景。


圖2是網路架構,其關鍵點在於hourglass的attention map以及attention和trunck branches的residual connection。具體的細節和公式請看論文,容易理解。下面的圖3比較詳細地說明了soft mask branch和trunk branch是怎樣的子結構。


至於效果嘛,看下面的tab 7


筆者簡單套用了下residual這個方式,即(1+M(X))*T(X)到筆者的一個task上,發現是有1%的提升的。

===== 如果這篇博文對你有幫助,可否賞筆者喝杯奶茶?