論文筆記《Active Convolution: Learning the Shape of Convolution for Image Classification》

阿新 • • 發佈：2018-12-19

研究背景

近年來，深入學習在許多計算機視覺應用中取得了巨大的成功。傳統的卷積神經網路（CNN）成為最近幾年計算機視覺研究的主要方法。

AlexNet 迄今為止，關於CNN的大多數研究集中在開發諸如Inception , residual networks的這種網路結構上。卷積單元通常設定為3*3，5*5，11*11 這種固定的卷積單元。但是卷積層是CNN的核心，卻很少有研究針對卷積單元本身。

CNN模型	Layers	convolutions	Contribution	ILSVRC top-5 error
AlexNet	8層（5 +3）	33 , 55 , 11*11	Dropout ReLU	16.4%
VGGNet	16層（13+3）	11，33	1*1卷積核更深的網路效果更好	7.3%
GoogleNet	22層	11 , 33 , 5*5	Inception	6.7%
ResNet	152	11 , 33 , 7*7	shortcut	3.57%

研究內容

在本文中，提出了一種新的卷積單元。和傳統的卷積單元及其變形不同，這種卷積單元並不具有一個固定的感受野，並且它能為不同的卷積層獲得不同的感受野。

由於卷積單元的形狀可變，因此稱它為主動卷積單元ACU(Active Convolution Unit）。這種新的卷積單元沒有固定的形狀，它的形狀是在訓練的過程中學習得到的。因此我們可以定義任何形式的卷積。

一，ACU的優點

ACU的優點

：更靈活的結構 à 更強的表達能力

1，ACU是一般化的卷積;它不僅可以定義所有傳統的卷積，還可以定義具有區域性畫素座標的卷積。我們可以自由地改變卷積的形狀，從而提供更大的自由形成CNN結構。

2，卷積的形狀是在訓練時學習的，沒有必要手動調整。

3，ACU可以比傳統的卷積單元更好地學習，可以通過將傳統卷積改為ACU來獲得改進。

ACU：一種新的帶位置引數的卷積單元

ACU具有更強的表達能力

2，位置引數的學習

傳統的卷積可用如下等式描述：

ACU除了要訓練學習 weight 和 bais 引數外，還要學習位置引數來控制突觸在神經元之間的連線位置。

通過θp，可以定義ACU：

線性插值

雙線性插值

前向傳播

反向傳播

位置引數的學習

由此可以看出來只與權重有關

3，梯度歸一化

突觸位置的反向傳播值的大小控制其移動的大小。如果該值太小，突觸停留在幾乎相同的位置，因此ACU無效。相比之下，一個大的值使得突觸變化多樣化。因此，控制移動的大小很重要。

相對於位置的偏導數取決於權重，並且反向傳播的誤差可以在層之間波動。因此，確定位置的學習率比較困難。

減少層間梯度波動的一種方法是僅使用導數的方向，而不是大小。當我們使用歸一化的位置梯度時，我們可以很容易地控制移動位置的大小。在實驗中觀察到，使用歸一化梯度使得訓練更容易，並獲得了良好的效果。

歸一化的位置梯度定義為：

初始的學習率設定為 0.001 ，這意味著突觸在每次迭代後，只能移動 0.001 個畫素點。也就是說，在一千次迭代後，突觸最多隻能移動一個畫素點。

由於最開始的weight值是一般是從隨機分佈中初始化得到的，早期的突觸的移動會變得相對隨機，這使得position可能會保持區域性最小值。

在早期的迭代中，網路的卷積單元具有固定的形狀。之後才開始同時學習weight和position，這樣會幫助突觸學習到一個更穩定的形狀。

實驗過程及結果

ACU with a Plain Network

1，僅包含卷積層，不含池化層

2，使用了批歸一化，ReLU

3，突觸初始形狀和傳統的3*3卷積單元相同

4，使用 CIFAR-10/100 資料集

網路結構

位置的學習

ACU with the Residual Network

總結

ACU ( Active Convolution Unit ) 相比傳統的卷積單元擁有更好的靈活性，因此在表達能力上更強。使用ACU會增加較少的 position 引數，position 可以在反向傳播中得到學習。

實驗結果表明，通過簡單地改變卷積單元的結構，網路取得了更好的 performance

簡潔版 CVPR-2017論文筆記《Active Convolution: Learning the Shape of Convolution for Image Classification》

作者提出一種靈活的卷積單元，形狀在訓練中學習得到，這種結構使得網路具有更強的表達能力。這篇論文提出了一種新的卷積單元，主動卷積單元ACU（Active Convolution Unit）,在次之前，從AlexNet到如今的ResNet，GoogleNet等各種網路架構的提出，人們研究的基本

論文筆記《Active Convolution: Learning the Shape of Convolution for Image Classification》

研究背景近年來，深入學習在許多計算機視覺應用中取得了巨大的成功。傳統的卷積神經網路（CNN）成為最近幾年計算機視覺研究的主要方法。 AlexNet 迄今為止，關於CNN的大多數研究集中在開發諸如Inception , residual networks的這種網路結構上。

《Active Convolution- Learning the Shape of Convolution for Image Classification》論文閱讀

paper 動機以前的網路都是關注cnn的網路結構，比如ResNet，Inception等這裡關注卷積這個操作本身，貢獻提出了Active Convolution Unit，方法 ACU概念

【論文閱讀】Bag of Tricks for Image Classification with Convolutional Neural Networks

Bag of Tricks for Image Classification with Convolutional Neural Networks 論文：https://arxiv.org/pdf/1812.01187.pdf 本文作者總結了模型訓練過程中可以提高準確率的方法,如題，

論文筆記：Fisher Kernels on Visual Vocab ularies for Image Categorization

Fisher Kernels on Visual Vocabularies for Image Categorization 論文連結：CVPR 2006 在模式分類領域，Fisher Vector（FV）是一個強有力的構架，因為他結合了生成式（概率密

[深度學習] Image Classification影象分類之Bag of Tricks for Image Classification with Convolutional Neural Net

論文全稱：《Bag of Tricks for Image Classification with Convolutional Neural Networks》論文地址：https://arxiv.org/pdf/1812.01187.pdf 這篇文章主要討論最近這些訓練神經網路的tric

「Computer Vision」Note on Bag of Tricks for Image Classification

QQ Group: 428014259 Sina Weibo：小鋒子Shawn Tencent E-mail：[email protected] http://blog.csdn.net/dgyuanshaofeng/article/details/84843079 [1]

Bag of Tricks for Image Classification with Convolutional Neural Networks

Bag of Tricks for Image Classification with Convolutional Neural Networks，李沐大神18年12月的新作，用卷積神經網路進行影象分類的一些技巧。論文：Bag of Tricks for Image Classific

論文筆記6：Increasing the Action Gap: New Operators for Reinforcement Learning

參考文獻：New Operators for Reinforcement Learning 同名知乎：uuummmmiiii 這篇文章實在是式子多，整個看懵，網上目前沒啥人看過這篇，論文有兩部分，我掙扎了一下看了第一部分，所以第二部分具體作者創新了什麼，做了什麼相關推導我也不知道，哭泣。如有

【論文筆記】Unsupervised Learning of Video Representations using LSTMs

這篇文章是深度學習應用在視訊分析領域的經典文章，也是Encoder-Decoder模型的經典文章，作者是多倫多大學深度學習開山鼻祖Hinton教授的徒子徒孫們，引用量非常高，是視訊分析領域的必讀文章。摘要翻譯我們使用長短時記憶（Long Short

5、AFM（Attention+FM）-----Attentional Factorization Machines:Learning the Weight of Feature Interactions via Attention Network

factor eat .com 問題架構機器 tran 權重 machine 1、摘要：提出一個Attentional FM，Attention模型+因子分解機，其通過Attention學習到特征交叉的權重。因為很顯然不是所有的二階特征交互的重要性都是一樣的，如何

推薦系統論文筆記（4）：Comparison of Collaborative Filtering Algorithms:Limitations of Current Techniques .....

一、基本資訊論文題目：《Comparison of Collaborative Filtering Algorithms:Limitations of Current Techniques and Proposals for Scalable,High-Performance Recommen

Opinionated and open machine learning: The nuances of using Facebook's PyTorch ZDNet

Chintala's take is that some people would have to be assigned on something like this anyway. If PyTorch had not been created, the other option would be to

影象隱寫術分析論文筆記：Deep learning for steganalysis via convolutional neural networks

好久沒有寫論文筆記了，這裡開始一個新任務，即影象的steganalysis任務的深度網路模型。現在是論文閱讀階段，會陸續分享一些相關論文，以及基礎知識，以及傳統方法的思路，以資借鑑。這一篇是Media Watermarking, Security, and Forensi

論文筆記：Deep Learning [nature review by Lecun, Bengio, & Hinton]

假設我們需要訓練一個深度神經網路來預測一段文字序列的下一個單詞。我們用一個one-of-N的0-1向量來表示上下文中出現的單詞。神經網路將首先通過一個embedding層為每一個輸入的0-1向量生成一個word vector，並通過剩下的隱藏層將這些word vector轉化為目標單詞的word vector

iOS CoreAudio學習筆記（二）—— The Story of Sound

在上一章，我們初次嘗試了CoreAudio API：它提供了什麼以及怎樣呼叫它的函式。現在是時候往回一步來看看一張更大的圖：一開始CoreAudio訪問的問題。這一章將介紹基礎的聲音科學，它是什麼，它怎樣工作。事實證明，計算機的數字化天性使它們並不那麼適合處

The More You Know: Using Knowledge Graphs for Image Classification ——用知識圖譜進行影象分類論文閱讀筆記

Abstract 使人類區別於現代基於學習的計算機視覺演算法的一個特徵是獲得關於世界的知識並使用該知識推理關於視覺世界的能力。人類可以瞭解物體的特徵以及它們之間發生的關係，從而學習各種各樣的視覺概念，並且可以通過很少的例子學習。本文研究了知識圖譜形式的結構化先驗知

論文筆記：目標追蹤-CVPR2014-Adaptive Color Attributes for Real-time Visual Tracking

exploit orm dom ons tail red 最好早期形式化基於自適應顏色屬性的目標追蹤 Adaptive Color Attributes for Real-Time Visual Tracking 基於自適應顏色屬性的實時視覺追蹤 3月講的第一

論文筆記-DeepFM: A Factorization-Machine based Neural Network for CTR Prediction

contain feature 比較 san date res 離散 edi post 針對交叉（高階）特征學習提出的DeepFM是一個end-to-end模型，不需要像wide&deep那樣在wide端人工構造特征。網絡結構： sparse feature

論文筆記——An online EEG-based brain-computer interface for controlling hand grasp using an adaptive probabilistic neural network（10年被引用66次）

不同 -s evel 模型 his ren 虛擬 dem virt 題目：利用自適應概率網絡設計一種在線腦機接口樓方法控制手部抓握概要：這篇文章提出了一種新的腦機接口方法，控制手部，系列手部抓握動作和張開在虛擬現實環境中。這篇文章希望在現實生活中利用腦機接口技術控制抓握。

論文筆記《Active Convolution: Learning the Shape of Convolution for Image Classification》

研究背景

研究內容

一，ACU的優點

2，位置引數的學習

3，梯度歸一化

實驗過程及結果

總結

相關推薦