1. 程式人生 > >影象目標檢測 | RFCN 論文解析(1)

影象目標檢測 | RFCN 論文解析(1)

  • ROI pooling的輸入和輸出:ROI pooling操作的輸入(對於C+1個類)是k^2*(C+1)*W' *H'(W'和H'是ROI的寬度和高度)的score map上某ROI對應的那個立體塊,且該立體塊組成一個新的k^2*(C+1)*W' *H'的立體塊:每個顏色的立體塊(C+1)都只摳出對應位置的一個bin,把這k*k個bin組成新的立體塊,大小為(C+1)*W'*H'。例如,下圖中的第一塊黃色只取左上角的bin,最後一塊淡藍色只取右下角的bin。所有的bin重新組合後就變成了類似右圖的那個薄的立體塊(圖中的這個是池化後的輸出,即每個面上的每個bin上已經是一個畫素。池化前這個bin對應的是一個區域,是多個畫素)。ROI pooling的輸出為為一個(C+1)*k*k的立體塊,如下圖中的右圖。更詳細的有關ROI pooling的操作如公式(1)所示: