1. 程式人生 > >【論文筆記-Stereo】Pyramid Stereo Matching Network

【論文筆記-Stereo】Pyramid Stereo Matching Network

論文思想

  1. 使用ResNet提取特徵
  2. 用dilated convolution增大感受野
  3. 用Pyramid pooling module,提取各個scale的特徵,使之包含global的context資訊
  4. 用feature volume shift構建volume
  5. 用stacked hourglass 3D CNN(encoder-decoder)來處理cost volume,在訓練過程中使用不同層級的hourglass的輸出算加權loss
  6. end-to-end stereo estimation
  7. 在KITTI上取得了當時最好的結果

筆記

結構

architecture

cost_volume

disparity_learning

這裡寫圖片描述

視差計算(迴歸方法)

DIsparity regression

dpred=idmaxdiσ(di)
與MC_CNN,Content-CNN不同,此時的d是連續值。

損失函式

smooth_l1_loss, 在目標檢測中常被使用,對outlier的魯棒性更強。(outlier容易造成梯度爆炸,把MSE>1的部分改為l1,梯度由(x-t)變為+-1)