深度學習系列之FPN 個人總結

阿新 • • 發佈：2018-12-31

FPN是一種優化手段，利用特徵金字塔來進行目標檢測。同時還進行了不同解析度feature map的融合，將低層feature map的高解析度資訊與高層feature map的高語義資訊做了結合。

1. 常見的4種特徵金字塔

這裡寫圖片描述
(a) 由影象金字塔生成特徵金字塔，然後分別在每層feature map上做預測，例如OverFeat

(b) 單特徵對映: 直接在最後一層feature map上做預測。如Fast R-CNN、Faster R-CNN

(d) FPN，就是本文的。利用卷積過程中產生的不同層級的feature map，自上而下(top-down),對上層的feature map做上取樣

，下層的feature map做1x1的卷積(為了使channel和上層相同)，然後融合成一個feature map，進行預測。

2. FPN的Top-down結構與橫向連線

上面(d)已經講了，這裡再配個圖說明一下。
這裡寫圖片描述
將上層的粗糙的解析度的feature map進行上取樣，與下層高解析度的feature map融合。好吧，YOLOv3就是這樣的。融合後，FPN再用一個3x3的卷積核處理，得到最終要預測的feature map。如此一來，就可以將上層豐富的語義資訊和下層的高解析度資訊結合，有利於小目標的檢測。

高解析度影象對小目標的檢測是非常重要的，因為隨著下采樣，解析度降低，小目標的資訊也會丟失很嚴重。

深度學習系列之FPN 個人總結

1. 常見的4種特徵金字塔

2. FPN的Top-down結構與橫向連線

深度學習系列之FPN 個人總結

深度學習系列之YOLOv3 個人總結

深度學習系列之R-FCN個人總結

深度學習系列之SSD(Single Shot MultiBox Detector) 個人總結

深度學習系列之 mAP

JVM深度學習系列之記憶體使用細節(三)

JVM深度學習系列之位元組碼檔案學習(二)

深度學習系列之YOLOv3 mAP計算

JVM深度學習系列之虛擬機器引數彙總(五)

深度學習系列之（dlib+opencv）程式碼收藏

Python 機器學習系列之線性迴歸篇深度詳細

Service Mesh深度學習系列|istio原始碼分析之pilot

[050]Python 機器學習系列之線性迴歸篇深度詳細

深度學習系列文章之二上：win7+Ubantu雙系統裝機步驟（硬碟安裝）

深度學習系列文章之二下：win7+Ubantu雙系統裝機步驟（硬碟安裝）

深度學習系列——關於神經網路理解的總結

Matlab影象識別/檢索系列(7)-10行程式碼完成深度學習網路之取中間層資料作為特徵（轉載）

深度學習系列文章之二中：win7+Ubantu雙系統裝機步驟（硬碟安裝）

(重磅)深度強化學習系列之（7）-----強化學習《獎勵函式》的設計和設定（reward shaping）

CSS3學習系列之選擇器（二）

深度學習系列之FPN 個人總結

1. 常見的4種特徵金字塔

2. FPN的Top-down結構與橫向連線

相關推薦