1. 程式人生 > >Mask-RCNN中的ROIAlign, ROIPooling及ROIWarp對比

Mask-RCNN中的ROIAlign, ROIPooling及ROIWarp對比

RoI Pooling 實現從原圖ROI區域對映到卷積區域最後pooling到固定大小的功能,然後通過池化把該區域的尺寸歸一化成卷積網路輸入的尺寸。

ROIAlign 上面RoI Pooling從原圖ROI對映到卷積區域,即原圖ROI與特徵圖ROI之間的對映,使用了stride間隔的取整,使得特徵圖ROI再映射回原圖ROI的時候有stride的誤差。尤其經過最大值池化後的特徵與原ROI之間的空間不對齊就更加明顯了。  因此,ROIAlign從原圖到特徵圖直接的ROI對映直接使用雙線性插值,不取整,這樣誤差會小很多,經過池化後再對應回原圖的準確性也更高些。  這裡假設得到的浮點型座標為(x,y),取其周圍最近的四個點,在Y方向內插兩次,再在X方向內插一次,得到新的值。ROI的形狀是不變化的。  但是下面的warp是先改變形狀的,這也是這兩種操作的不同之處。

RoI Warping Layer 在pooling層前面,新增一層,將特徵圖crop一塊,然後warp到固定的尺寸,這裡的warp採用長度和寬度兩個方向的雙線性插值。  具體參考如下網址:http://dubur.github.io/

align?一致嗎?個人覺得資訊的降維,必然會有一定的損失即使是ROIAlign也不可能完全對齊,只能相對精確罷了。 ---------------------  作者:lanyuxuan100  來源:CSDN  原文:https://blog.csdn.net/lanyuxuan100/article/details/71124596?utm_source=copy  版權宣告:本文為博主原創文章,轉載請附上博文連結!