Stacked Hourglass Networks for Human Pose Estimation

阿新 • • 發佈：2018-12-02

介紹

這是一篇2016年做單人姿態估計的文章

實驗用的是MPII sigle 和 FLIC ，指標PCKh

通過堆疊沙漏結構的網路進行人體姿態估計

沙漏結構指通過pooling得到低解析度的特徵，然後通過上取樣得到高解析度特徵的網路結構

論文指出該網路可以捕獲並控制影象所有尺度上的資訊。

另一方面，沙漏網路區別於先前的設計，主要在其更對稱的拓撲結構。

通過連續堆放這樣的沙漏網路，可以實現重複的bottom-up，top-down的推理

論文所提結構成功的原因有兩點：

上述的重複雙向推理
訓練過程中使用了中間監督

這個單沙漏網路的特點在於在推導heatmap時，既使用到高層的語義，也結合了底層的紋理資訊，這樣使得定位更加準確

然後通過多個沙漏網路堆疊方式，讓後面的網路學習前面網路學習不到的東西，即更難的骨骼關鍵點檢測，finetune再finetune,取得更好的結果下面左邊的圖展示了，第二層hourglass輸出和最後一層（第八層）的結果對比，從例子看明顯第八層的finetune後結果比第二層要好不少

上面右邊的圖是為了說明效能提升究竟是加深網路導致的，還是本文所提的堆疊多個finetune沙漏結構所取得的

中間的圖是PCKh結果，上面的點是各網路各子沙漏的結果，同意網路，越往後的層效果越好，網路深度相同的情況下，分越多的子沙漏會比分的少網路，最終輸出的結果會高那麼一點點

感覺這裡缺了一個單層的結果，即沒有finetune時的效果，當然也可以把總網路的一半當作是單層效果，分別看分兩層和4層的效果如何（0.846，0.865，0.871）

論文筆記 Stacked Hourglass Networks for Human Pose Estimation

Stacked Hourglass Networks for Human Pose Estimation key words:人體姿態估計 Human Pose Estimation 給定單張RGB影象，輸出人體某些關鍵點的精確畫素位置.堆疊式沙漏網路 Stacked Hourglass Net

Stacked Hourglass Networks for Human Pose Estimation

介紹這是一篇2016年做單人姿態估計的文章實驗用的是MPII sigle 和 FLIC ，指標PCKh 通過堆疊沙漏結構的網路進行人體姿態估計沙漏結構指通過pooling得到低解析度的特徵，然後通過上取樣得到高解析度特徵的網路結構論文指出該網路可以捕

姿態檢測整理--01-Stacked Hourglass Networks for Human Pose Estimation

Stacked Hourglass Networks for Human Pose Estimation（發表於2016年）基本上是目前姿態研究的基礎網路，具有bottom-up和top-down二者特性。bottom-up是先得到肢體再歸併到不同個體。

Beyond Tree Structure Models: A New Occlusion Aware Graphical Model for Human Pose Estimation論文小摘

一、介紹這篇文章是2015年的ICCV的文章，當時還是非常流行使用“樹結構”以及“圖模型”來解決“姿態估計”問題的。這篇文章的核心內容是要去解決，姿態估計過程中面臨的一個挑戰“遮擋”問題。文章中將遮擋分為了兩類進行討論，第一類是自遮擋，第二類是其

Learning Feature Pyramids for Human Pose Estimation（理解）

0 - 背景　　人體姿態識別是計算機視覺的基礎的具有挑戰性的任務，其中對於身體部位的尺度變化性是存在的一個顯著挑戰。雖然金字塔方法廣泛應用於解決此類問題，但該方法還是沒有很好的被探索，我們設計了一個Pyramid Residual Module（PRMs）來提高DCNNs的尺度不變性。　　

Simple Baselines for Human Pose Estimation and Tracking

介紹微軟神作，pose track 的新base line 比ICCV Pose track 冠軍在mAP上高15個點，在MOTA上高6個點姿態估計一個簡單的ResNet 結構三個卷積層+BN+ReLU 中間一個1*1的卷積層產生pose的h

Adversarial PoseNet: A Structure-aware Convolutional Network for Human Pose Estimation翻譯

對抗性的PoseNet:一種對於人類姿態估計的結構感知的卷積網路摘要：在單目影象中，人的姿態估計，關節遮擋和重疊在人體上經常導致偏差的姿勢預測。在這種情況下，可能會產生生物學上難以置信的姿態預測。與此相反，人類視覺通過利用節點間連線的幾何約束來預測姿態。為了解決這一問題，

《Simple Baselines for Human Pose Estimation and Tracking》閱讀筆記

《Simple Baselines for Human Pose Estimation and Tracking》閱讀筆記《Simple Baselines for Human Pose Estimation and Tracking》閱讀筆記姿

論文閱讀 Multi-Scale Structure-Aware Network for Human Pose Estimation

1、文章在hourglass的網路基礎上做了四點改進 1）多尺度監督來加強語義特徵學習來融合多尺度的特徵 2）多尺度的迴歸網路來優化整體的人體結構 3）structure-aware損失（在多

DeepPose: Human Pose Estimation via Deep Neural Networks論文翻譯

翻譯點選連結獲取基本思想級聯網路架構：在第一階段將影象輸入後得到大致位置，在之後的階段利用相同的網路架構得到更精細的結果。對級聯的所有階段使用相同的網路架構，但學習不同的網路引數。其中網路架構使用的是Alex，所不同的是loss函式，AlexNet是用於分類的，而本文的架構是用於迴

【姿態估計】DeepPose: 基於深度神經網路的人體姿態估計 Human Pose Estimation via Deep Neural Networks

Alexander Toshev Christian Szegedy Google 1600 Amphitheatre Pkwy Mountain View, CA 94043 toshev,[e

DensePose: Dense Human Pose Estimation In The Wild（理解）

0 - 背景　　Facebook AI Research（FAIR）開源了一項將2D的RGB影象的所有人體畫素實時對映到3D模型的技術（DensePose）。支援戶外和穿著寬鬆衣服的物件識別，支援多人同時識別，並且實時性良好。 1 - 思路 1.1 - 標註資料集　　對於一般的姿態識別（骨骼追蹤）

DensePose:Dense Human Pose Estimation In The Wild 論文閱讀筆記

一、本文主要是Facebook AI 和INRIA 聯合出品，基於RCNN架構，以及Mask RCNN的多工結構，開源http://densepose.org 二、主要工作分為三點 1：標註了一個新的資料集，基於coco資料集，增加了u

論文解讀：Stacked Attention Networks for Image Question Answering

這是關於VQA問題的第二篇系列文章，這篇文章在vqa領域是一篇比較有影響的文章。本篇文章將介紹論文：主要思想；模型方法；主要貢獻。有興趣可以檢視原文：Stacked Attention Networks for Image Question Answering。原論文中附有作者原始碼。

Summary——DensePose: Dense Human Pose Estimation In The Wild

Research question：在一張RGB圖片和一個曲面模型上建立對應。RGB圖片來自COCO資料集（本文篩選出含有人物的圖片），除此之外，由一個人體的表面模型（這個模型應該是立體的）為24個體塊分別找到六張不同角度（當呈現在標註者面前的時候也是平面的圖片），本文就

人體姿態估計（Human Pose Estimation）---優質學習資源

目錄 0、簡介這是一個簡單的資源僅供參考，Just for Xiuyun-Mo 0、簡介姿態估計的目標是在RGB影象或視訊中描繪出人體的形狀，這是一種多方面任務，其中包含了目標檢測、姿

Survey on Human pose estimation

關於姿態估計的一些總結，GitHub上搬的 Papers 2D Pose estimation 3D Pose estimation Person generation Pose Guided Person Image Generation - [CODE] - M

Human Pose Estimation Papers

Multi-Scale Structure-Aware Network for Human Pose Estimation - 2018 [Paper] Integral Human Pose Regression [Paper] Human Pose Regression by Combining Ind

人體姿態估計(Human Pose Estimation)文獻綜述

一、研究背景維基百科對人體姿態估計的定義如下： Articulated body pose estimation in computer vision is the study of algorithms and systems that recover the pos

human pose estimation

ask ani bottom ase ngxin mat vol mod realtime 2D Pose estimation主要面臨的困難：遮擋、復雜背景、光照、真實世界的復雜姿態、人的尺度不一、拍攝角度不固定等。單人姿態估計傳統方法：基於Pictorial Str

Stacked Hourglass Networks for Human Pose Estimation

介紹

相關推薦