《2018-Deep Progressive Reinforcement Learning for Skeleton-based Action Recognition》

阿新 • • 發佈：2018-11-24

動機

這篇文章開篇就指出，我們的模型是要從人體動作的序列中選取出最informative的那些幀，而丟棄掉用處不大的部分。但是由於對於不同的視訊序列，挑出最有代表性的幀的方法是不同的，因此，本文提出用深度增強學習來將幀的選擇模擬為一個不斷進步的progressive process。
強化學習是通過優化選擇actions的policy來最大化agent從environment所獲得的rewards。文章中說至今為止，在動作識別領域，增強學習的應用還不多。
做skeleton based action recognition會用到人體關節的鄰接矩陣，之前做skeleton based action recognition基本都是有骨骼相連的關節對才會在鄰接矩陣的相應位置標記一個1，沒有連線的位置就標記為0

但本文不同，本文考慮到不相連的關節之間的相互關係也是很重要的，比如兩隻手不是直接相連的，但是兩隻手的相互位置關係在識別‘拍手’這個動作時就尤為重要。

方法

本文的人體關節鄰接矩陣是這麼設計的：如果兩個關節有連線，就在鄰接矩陣相應位置標記為α，稱之為intrinsic dependencies，否則標記為β，稱之為extrinsic dependencies。此外關節沒有self connection，是鄰接矩陣對角元素全是0.
思路簡單概括為：
1. 我們的輸入是一段視訊，視訊中有多個幀。
2. 我們想用RL的演算法來選擇關鍵幀（本文是FDNet）
3. 再把選取到的關鍵幀輸入到GCNN網路，得到這個vedio的標籤

定義問題的決策鏈

已知輸入的是含有多個幀的一段視訊，但我們不要全部用到全部幀數
所以我們想提取關鍵幀，設定提取的關鍵幀數為m,把這m個關鍵幀按序號排序，每一個action表示這些關鍵幀是要向左移動，向右移動或是保持當前位置。
設定迭代步數，當程式迭代步數達到設定值時，就停止程式；

State and Action

State

針對選關鍵幀這個MDP問題，狀態S可以表示為： {Sa,Sb}
即它由來兩部分組成，其中Sa=[F,M] 也是由兩部分組成的。F表示整個視訊的資訊，它張量的形狀為：f×N×3。其中f表示視訊的所有幀數，N表示每一幀中的骨架模型的節點數，3表示每一個骨架節點的3D座標。如下圖所示是一個拍手動作的其中三幀，每一幀都是用一些骨架資訊表示，其中包含了骨架中有多少個關節節點以及它們的3D座標。

對於M就表示所有被提取的關鍵幀資訊，用一個形如m×N×3的張量表示，其中m表示關鍵幀的數目
最後Sb one-hot, 它對應到整個視訊的每一幀，如果對應的元素值為1,那麼說明該幀被提取為關鍵幀，其餘則為0 ;

Action

action的動作由FDNet輸出
action的定義比較簡單：

幀向左移動
幀向右移動
幀保持不動

現在，我們開啟看一下FDNet網路的結構

Reward function

1542282682251

GCNN

1542282748198

演算法

《2018-Deep Progressive Reinforcement Learning for Skeleton-based Action Recognition》

動機這篇文章開篇就指出，我們的模型是要從人體動作的序列中選取出最informative的那些幀，而丟棄掉用處不大的部分。但是由於對於不同的視訊序列，挑出最有代表性的幀的方法是不同的，因此，本文提出用深度增強學習來將幀的選擇模擬為一個不斷進步的progressive proces

論文筆記之：Collaborative Deep Reinforcement Learning for Joint Object Search

region format es2017 join sid col str bottom respond Collaborative Deep Reinforcement Learning for Joint Object Search CVPR 2017 Motiva

「Medical Image Analysis」Note on Deep Reinforcement Learning for Vessel Centerline Tracing

[1] Deep Reinforcement Learning for Vessel Centerline Tracing in Multi-modality 3D Volumes MICCAI 20

Deep Learning for Content-Based Image Retrival:A Comprehensive Study 學習筆記

3.1Deep Convolutional Neural Networks 採用的深度學習模型是[1] 為了減少過擬合，使用了兩種資料增強的方式：（1）從原始的256×256的影象中通過轉變和水平對映（translation and horizontal reflectio

DRL前沿之：Benchmarking Deep Reinforcement Learning for Continuous Control

1 前言 Deep Reinforcement Learning可以說是當前深度學習領域最前沿的研究方向，研究的目標即讓機器人具備決策及運動控制能力。話說人類創造的機器靈活性還遠遠低於某些低等生物，比如蜜蜂。。DRL就是要幹這個事，而是關鍵是使用神經網路來進行

論文筆記 — MatchNet: Unifying Feature and Metric Learning for Patch-Based Matching

　　論文：https://github.com/ei1994/my_reference_library/tree/master/papers 　　本文的貢獻點如下：　　1. 提出了一個新的利用深度網路架構基於patch的匹配來明顯的改善了效果；　　2. 利用更少的描述符，得到了比state-of-t

論文筆記：MatchNet: Unifying Feature and Metric Learning for Patch-Based Matching

Abstract MatchNet：一個用來從patches中提取特徵的深度卷積網路 + 一個用來比較提取出的特徵相似度的三層全連結網路構成。 Introduction 在MatchNet中，每個patch輸入卷積網路，生成一個固定維度的類似

【論文筆記】Deep Structured Output Learning for Unconstrained Text Recognition

寫在前面：我看的paper大多為Computer Vision、Deep Learning相關的paper，現在基本也處於入門階段，一些理解可能不太正確。說到底，小女子才疏學淺，如果有錯誤及理解不透

視覺場景理解論文閱讀筆記2:Hierarchically Structured Reinforcement Learning for Topically Coherent Visual Story

一、文章相關資料二、閱讀筆記1.論文思想針對序列影象生成故事描述的需求，使用層次結構的網路進行解碼學習。高階網路用於學習序列中每幅影象的語義資訊，所屬主題；低階網路用於根據學到的主題與語義屬性逐詞逐句生成句子描述。2.結構（1）Manager-Worker 框架

001: MatchNet: Unifying Feature and Metric Learning for Patch-Based Matching

Abstract 本文提出的MatchNet包含了（1）從patches中提取特徵的DCNN（深度卷積神經網路）（2）一個有著三個全連線層的網路。為了保證實驗可以復現，本文在標準的資料集上對MatchNet進行訓練。我們將MatchNet拆成feature c

《An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its...》論文閱讀之CRNN

An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition paper: CRNN 翻譯：CRNN

深度學習論文翻譯解析（二）：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition

論文標題：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition 論文作者： Baoguang Shi, Xiang B

《2018-Deep Progressive Reinforcement Learning for Skeleton-based Action Recognition》

動機

方法

定義問題的決策鏈

State and Action

State

Action

Reward function

GCNN

演算法

《2018-Deep Progressive Reinforcement Learning for Skeleton-based Action Recognition》

論文筆記之：Collaborative Deep Reinforcement Learning for Joint Object Search

「Medical Image Analysis」Note on Deep Reinforcement Learning for Vessel Centerline Tracing

Deep Learning for Content-Based Image Retrival:A Comprehensive Study 學習筆記

DRL前沿之：Benchmarking Deep Reinforcement Learning for Continuous Control

論文筆記 — MatchNet: Unifying Feature and Metric Learning for Patch-Based Matching

論文筆記：MatchNet: Unifying Feature and Metric Learning for Patch-Based Matching

【論文筆記】Deep Structured Output Learning for Unconstrained Text Recognition

視覺場景理解論文閱讀筆記2:Hierarchically Structured Reinforcement Learning for Topically Coherent Visual Story

001: MatchNet: Unifying Feature and Metric Learning for Patch-Based Matching

《An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its...》論文閱讀之CRNN

深度學習論文翻譯解析（二）：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition

論文筆記：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application

DRN: A Deep Reinforcement Learning Framework for News Recommendation學習

論文閱讀——《Crafting a Toolchain for Image Restoration by Deep Reinforcement Learning》

論文閱讀筆記——《Crafting a Toolchain for Image Restoration by Deep Reinforcement Learning》

17-11-22 Deep Reinforcement Learning-based Image Captioning with Embedding Reward論文隨筆

Playing Atari with Deep Reinforcement Learning

Deep Learning for Robotics 資源匯總

DeepEyes: 用於深度神經網絡設計的遞進式可視分析系統 (DeepEyes: Progressive Visual Analytics for Designing Deep Neural Networks)

《2018-Deep Progressive Reinforcement Learning for Skeleton-based Action Recognition》

動機

方法

定義問題的決策鏈

State and Action

State

Action

Reward function

GCNN

演算法

相關推薦