【論文閱讀】Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?

阿新 • • 發佈：2019-01-09

【論文閱讀】Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?

之前提出的3D卷積網路的深度都很淺，因為當時的資料集都小，很容易過擬合。但是現在有了kinetics，那麼這個資料集在訓練3D卷積網路時還會過擬合嗎？本文經過實驗發現，kinetics資料集即使在訓練非常深的3DCNN時也不會過擬合。我們知道在影象領域，通常都會使用Imagenet預訓練的網路，所以受此啟發，可以將在kinetics預訓練的網路應用到視訊分析相關的應用中。所以我在這裡再次安利一下作者的github地址，做視訊相關內容的一定要關注一下。
論文地址：

下載地址
作者的github（極力安利）：下載地址

正文

3DCNN很早之前就提出來了，但是一直受限於資料集，所以一直無法超越基於雙流網路的方法，最近kinetics資料集提出來了，那麼視訊中的kinetics資料集是否可以比肩影象中的ImageNet資料集呢？如果非常深的3DCNN在kinetics上訓練不會過擬合，那麼回答就是肯定的。所以基於此，作者做了許多的相關實驗。

實驗網路結構

首先需要確定實驗的3D卷積網路結構，因為殘差結構在2D影象中表現非常好，所以所有的3D卷積網路都是以殘差結構為基礎的。本文實驗的3D模型分別以 Resnet，Pre-activation Resnet

，Wide Resnet，Resnext以及Densenet等5種基本2D網路為基礎。具體的結構如下圖和下表所示（如果瞭解基本的網路結構還是很容易看懂的，如果哪裡看不懂可以留言或者去看一下原文，這裡就不做過多地介紹了）：
在這裡插入圖片描述

總結

這篇文章很簡單，我解讀的最主要的原因是安利文章的github，哈哈。

【論文閱讀】Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?

【論文閱讀】Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?

正文

實驗網路結構

相關實驗

較小的資料集是否出現了過擬合？

kinetics上能訓練多深的3D網路？

kinetics上預訓練的效果？

總結

【論文閱讀】Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?

【論文閱讀】Learning Spatiotemporal Features with 3D Convolutional Networks

【論文閱讀】Rethinking Spatiotemporal Feature Learning For Video Understanding

【論文閱讀】：Embedding-based News Recommendation for Millions of Users

【論文閱讀】A Closer Look at Spatiotemporal Convolutions for Action Recognition

【論文閱讀】Learning Spatio-Temporal Features with 3D Residual Networks for Action Recognition

【論文閱讀】ConvNet Architecture Search for Spatiotemporal Feature Learning

【論文閱讀】Siamese Neural Networks for One-shot Image Recognition

【論文閱讀】The Ubuntu Dialogue Corpus

【論文閱讀】Sequence to Sequence Learning with Neural Networks

【論文閱讀】韓鬆《Efficient Methods And Hardware For Deep Learning》節選《Learning both Weights and Connections 》

【論文閱讀】Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization

【論文閱讀】Clustering Convolutional Kernels to Compress Deep Neural Networks

【論文閱讀】Between-class Learning for Image Classification

【論文閱讀】Deep Adversarial Subspace Clustering

【論文閱讀】Deep Mixture of Diverse Experts for Large-Scale Visual Recognition

【論文閱讀】Learning Dual Convolutional Neural Networks for Low-Level Vision

【論文閱讀】Slot-Gated Modeling for Joint Slot Filling and Intent Prediction

【論文閱讀】《GloVe: Global Vectors forWord Representation》

【論文閱讀】《Delta TFIDF：An Improved Feature Space for Sentiment Analysis》（論文及實驗）

【論文閱讀】Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?

【論文閱讀】Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?

正文

實驗網路結構

相關實驗

較小的資料集是否出現了過擬合？

kinetics上能訓練多深的3D網路？

kinetics上預訓練的效果？

總結

相關推薦