1. 程式人生 > >pose machine論文基本思想和全文翻譯

pose machine論文基本思想和全文翻譯

pose machine論文基本思想和全文翻譯


基本思想

pose machine的整體流程圖
網路分為多個層級多個stage,每個層級的輸入是一個patch(影象的部分),即從影象中以點z(x,y)為中心得到的一個矩形框(可以設定不同的大小)。第一個stage的層級1將從patch得到的特徵 1 x z

作為輸入,經過多分類器 1 g 1 得到各個part的置信
1 b 1
,接下來的stage同時將特徵 1 x z 和上一個stage在不同層級上得到的上下文資訊
Ψ 作為輸入,經過分類器 1 g 2 得到這個階段各個part的置信,此時得到的結果比stage1的結果好。

這裡的上下文資訊 Ψ 分為兩部分,一部分是上下文patch特徵,一部分是上下文offset特徵。前一部分是每個層級上所有part在位置z處score的級聯,是對短距離的關係進行處理;後一部分先獲取所有part在l層級t-1 stage上的置信的峰值,然後計算part p從z到峰值k的極座標偏移向量,也對長距離的互動進行編碼。

論文翻譯連結