1. 程式人生 > >深度學習模型相關知識(2)

深度學習模型相關知識(2)

fas bubuko 深度學習 image ive bsp 提取 AS 簡寫

參考:https://blog.csdn.net/lanran2/article/details/60143861

ROI pooling:

ROI是Regin of Interest的簡寫,指的是特征圖上的框,特點在於輸入特征圖尺寸不固定,但是輸出特征圖尺寸固定。

這裏加一個Fast RCNN和Faster RCNN在ROI步驟前的區別:

1)在Fast RCNN中,RoI是指Selective Search產生的候選框在特征圖的映射

2)在Faster RCNN中,RoI是由RPN產生的候選框在特征圖的映射

技術分享圖片

如上為Fast RCNN的整體結構,經過提取候選框後完成在feature map上的映射,再經RoI pooling來將多個不同尺寸的RoI統一到相同的尺寸,然後再提取特征。

RoI pooling的輸出:

輸出的是batch個vector,其中batch的值是在上面的例子中是單個給定像素圖中RoI的個數,vector的大小為channel*w*h(這裏的channel也就是上面紅色小矩陣的厚度),也就是說RoI Pooling的過程就是將大小不同的box矩形框,映射成固定大小(w*h)的矩形框。

深度學習模型相關知識(2)