目標檢測中 Anchor 的認識及理解

技術 · 發表 2019-03-06 17:43:57

摘要：近期好多同學都在糾結Anchor的設定，而且部分同學私信，可不可以把這個基礎知識詳細說一次，今天就單獨開一次小課，一起來學習Faster R-CNN中的RPN及Anchor。說到RPN和Anchor，應該立馬就能想到Faster R-CNN網路框架，這個我平臺在之前就有詳細的介...

近期好多同學都在糾結Anchor的設定，而且部分同學私信，可不可以把這個基礎知識詳細說一次，今天就單獨開一次小課，一起來學習Faster R-CNN中的RPN及Anchor。

說到RPN和Anchor，應該立馬就能想到Faster R-CNN網路框架，這個我平臺在之前就有詳細的介紹過。

往期回顧

有興趣的可以點選進入看看，當作複習一下。首先我先將幾類經典的目標檢測網路做一個對比，然後開始說說今天要講的知識。

最開始出現的是R-CNN，如下圖：

從上圖可以看出其框架做了很多重複的計算，在第二步之後，如果有2k個proposals，那後面就要執行2k邊，太低效。於是，出現了改進的SSP-Net，如下圖：

SSP-Ne框架組合了Classification和Regression，做成單個網路，並且可以Een-to-End進行訓練，速度上提高許多。但是，SSP-Net還是基於Selective Search產生proposal，之後就出現了Fast R-CNN，其是融合了R-CNN和SPP-Net的創新，並且引入多工損失函式，使整個網路的訓練和測試變得十分方便。

但是Region proposal的提取還是使用了Selective Search，目標檢測時間大多消耗在這上面（大約region proposal需2~3s，而提特徵分類只需0.32s），這種是無法滿足實時應用，而且並沒有實現真正意義上的端到端訓練測試（因為region proposal使用了Selective Search先提取處來）。

於是就有了直接使用CNN產生region proposal並對其分類，這就是Faster R-CNN框架，如下圖：

Faster R-CNN將 proposals 交給了CNN去生成，這樣 Region Proposal Network（RPN） 應運而生。

Faster R-CNN

仔細看看Faster R-CNN框架，其實還保留了Fast R-CNN的框架，其主要就是CNN+RPN。其中 RPN主要就是負責生成proposals，然後與最後一層的feature map一起使用，用ROI Pooling生成固定長度的feature vector。具體如下：

那接下來開始好好的說一下RPN和Anchor！下圖是我從網路copy過來的，應該更加能理解整體的流程及內容。

在上圖中，紅色的3x3紅框是其中一個滑窗的操作過程，注意這裡的Anchor是原影象畫素空間中的，而不是feature map上的。這樣的話，就可以很好去知道Anchor的意思，而且Anchor對於RPN非常重要。

現在，我們假設現在的feature map尺寸為W x H x C（13x13x256就是feature map的Width=13，Height=13和Channel=256），在feature map使用滑動視窗的操作方式，當前滑窗的中心在原畫素空間的對映點就稱為Anchor，並且以Anchor為中心去生成K（paper中default K=9，3個尺寸和3個縮放比例）個proposals。