1. 程式人生 > >『演算法學習』CPN:Cascaded Pyramid Network for Multi-Person Pose Estimation

『演算法學習』CPN:Cascaded Pyramid Network for Multi-Person Pose Estimation

原文L:https://www.cnblogs.com/hellcat/p/10138036.html

論文連線

CVPR2018的文章,用於關鍵點檢測(原話叫“多人姿態估計”)。本算髮聚焦點在於處理多人姿態估計所面臨的挑戰:關鍵點遮擋,關鍵點不可見,複雜背景等——就是優化對於難以檢測的點的預測,即著重於處理 “hard” 關鍵點。

思路就是detector先定位bbox,然後使用CPN檢測關鍵點,其中原作者使用的是FPN進行bbox定位(下圖解釋了FPN的優越性),並應用了ROIAlign。

CPN本體由兩部分組成:GlobalNet和RefineNet,流程如下圖所示,GlobalNet對關鍵點進行粗提取,RefineNet精細加工難以識別的網路(RefineNet對不同層資訊進行了融合,可以更好的綜合特徵定位關鍵點)。

GlobalNet 採用類似於FPN的特徵金字塔結構,並在每個elem-sum前添加了1x 卷積。

RefineNet基於GlobalNet生成的特徵金字塔,其連結了所有層的金字塔特徵用於定位“hard”關鍵點。