1. 程式人生 > >roi pooling層

roi pooling層

提取 向量 cti 長度 cat 得到 轉化 特征 簡單

roi pooling是先進行roi projection(即映射)然後再池化

映射是把用來訓練的圖片的roi映射到最後一層特征層(即卷積層)。方法其實很簡單,圖片經過特征提取後,到最後一層卷積層時,真個圖片是原始圖片的1/16,你把roi的4個坐標都乘以1/16,也就變成了在這個卷積層上對應的坐標。這和我當時把1920x1200圖片轉化為960x600進行的gt-roi變換是一樣的。

得到roi在最後一層卷積層的坐標後,就把這個roi區域均分成HxW份,每份進行池化,最後再把這麽多份concatenate起來輸入給下一層。這樣所有roi,不論roi大小,生成的都是固定長度的一個向量給下一層。

roi pooling層