1. 程式人生 > >PSPnet:Pyramid Scene Parsing Network——作者認為現有模型由於沒有引入足夠的上下文信息及不同感受野下的全局信息而存在分割出現錯誤的情景,於是,提出了使用global-scence-level的信息的pspnet

PSPnet:Pyramid Scene Parsing Network——作者認為現有模型由於沒有引入足夠的上下文信息及不同感受野下的全局信息而存在分割出現錯誤的情景,於是,提出了使用global-scence-level的信息的pspnet

沒有 學習 text cti sce 足夠 tail 錯誤 實驗

from:https://blog.csdn.net/bea_tree/article/details/56678560
2017年02月23日 19:28:25 閱讀數:6094

首先聲明,文末彩蛋,不是筆者提問的

1 一句話總結

作者認為現有模型由於沒有引入足夠的上下文信息及不同感受野下的全局信息而存在分割出現錯誤的情景,於是,提出了使用global-scence-level的信息的pspnet,另外本文提出了引入輔助loss的ResNet優化方法。

2 網絡結構

本文提出的網絡結構簡單來說就是將DeepLab(不完全一樣)aspp之前的feature map pooling了四種尺度之後 將5種feature map concat到一起經過卷積最後進行prediction的過程。
技術分享圖片

3 ResNet

本文除了網絡之外,其ResNet的模型還是挺強的
技術分享圖片
技術分享圖片
如上圖,首先作者在訓練的時候加入了輔助loss,另外ResNet起始的7x7的卷積替換了三個3x3的卷積

4 實施細節

  • 使用了poly的學習策略,learning rate 0.01,power 0.9
  • momentum 0.9 weight decay 0.0001
  • random mirror
  • random resize [0.5,2]
  • random rotation [-10 degree,10 degree]
  • random gaussian blur
  • new caffe (batch size 16)
  • auxiliary loss weight to 0.4

5 Ablation study

作者通過實驗,驗證了文中各種設置的作用

5.1 psp net的作用(包括pooling的形式及數量)

技術分享圖片

5.2 auxiliary loss

技術分享圖片

5.3 pre-trained model

技術分享圖片

5.4 其他

技術分享圖片

6 知乎上的討論

技術分享圖片

技術分享圖片

PSPnet:Pyramid Scene Parsing Network——作者認為現有模型由於沒有引入足夠的上下文信息及不同感受野下的全局信息而存在分割出現錯誤的情景,於是,提出了使用global-scence-level的信息的pspnet