"CapProNet: Deep Feature Learning via Orthogonal Projections onto Capsule Subspaces"閱讀筆記

阿新 • • 發佈：2019-01-11

"CapProNet: Deep Feature Learning via Orthogonal Projections onto Capsule Subspaces" 閱讀筆記

capsule簡介
capsule subspace
正交投影
網路損失函式
實驗結果
視覺化實驗

原文連結： https://arxiv.org/abs/1805.07621v2
這篇論文利用了之前hinton大佬提出的capsule替換神經元的（一個capsule可以簡單的理解為一個向量）概念，提出了一種利用capsule subspace來進行分類的網路結構，稱為CapProNet。
接下來博主幫大家一點一點解析這篇論文的思想。

capsule簡介

capsule是hinton大佬從大腦結構受到啟發而提出的一種可以替換深度學習網路神經元的向量，目的是解決CNN的一些固有問題，比如CNN提取的特徵都是經過多次池化，可能會丟失較多的空間資訊等。
想要大致瞭解capsule以及capsulenet的原始架構可以看下圖：
在這裡插入圖片描述
想要深入瞭解可以閱讀原文:“Dynamic Routing Between Capsules”
其實，本文和上述的capsule之間的連線結構沒有很大關係，而是借用了capsule的概念用來作為CNN的分類器，即將每個類別使用一個capsule subspace來表達，CNN學習到的特徵向量會被正交投影到所有的subspace中，樣本會被分類為投影之後向量的長度（模長）最大的那個類別。這樣比起原來通過全連線層後進行Softmax分類，可以更充分的利用特徵向量的資訊。

capsule subspace

這裡的capsule subspace指由一組capsule張成的線性空間，即假設 $W_l$ 是多個capsule組成的矩陣，則capsule subspace $S$

l = s p a n ( W l ) S_l=span(W_l)

S_{l} = s p a n (W_{l})

正交投影

假設原特徵向量為x,通過一個投影矩陣P ,可以投影到子空間 $S_l$ 中，且P滿足 $P^T=P，P^2=P$ ，則P為正交投影。
關於P的求解簡單推導推薦看部落格https://www.cnblogs.com/mfrbuaa/p/5319365.html ，裡面寫了低維的情況，高維其實類似。也就是說投影的結果是有閉式解的，假設投影后為 $v_l$ ，則：
在這裡插入圖片描述
這裡的 $W^+_l$ 表示廣義逆矩陣，當W的列向量相互獨立時， $W^+_l$ 為：

由於我們只關心 $v_l$ 的長度，因此可以得到公式：

網路損失函式

最終樣本屬於每個類別的概率可以用Softmax來得到，因此網路採用Softmax交叉熵損失
在這裡插入圖片描述

有了上述的演算法，網路可以End to End的訓練了。其中計算量比較大的地方在矩陣求逆，但是文中也依據一些快速求逆方法提出了一些近似演算法用來加速這一過程，所有實用應該還是沒有問題的。

實驗結果

下表是在CIFAR10,CIFAR100,SVHN下的一個對比實驗，在這些資料集上都能有一定的提高：
在這裡插入圖片描述
下表是在ImageNet驗證集上的實驗，同樣也能提高網路的表現，這說明這一演算法在分類任務上應該有一定的普適性。

視覺化實驗

在這裡插入圖片描述
這個視覺化實驗是在CIFAR10上使用2D子空間，並且將一些樣本投影到各個不同類別的子空間後畫出的圖。
圖中一個座標軸表示一個類別，紅點為屬於這個類別的樣本，綠點為不屬於這個類別的樣本。
從圖中可以看到，經過訓練後的CapProNet可以有效的使得某類樣本投影到該類子空間後獲得更大的模值。

"CapProNet: Deep Feature Learning via Orthogonal Projections onto Capsule Subspaces"閱讀筆記

"CapProNet: Deep Feature Learning via Orthogonal Projections onto Capsule Subspaces" 閱讀筆記 capsule簡介 capsule subspace 正交投影網路

part-aligned系列論文：1707.Deep Representation Learning with Part Loss for Person ReID 論文閱讀筆記

Deep Representation Learning with Part Loss for Person ReID 本論文為了更好的提升reid模型在未見過的行人影象判別能力，正對現有大部分只有全域性特徵表達（轉化為分類，一般minimize the em

RCNN:Rich feature hierarchies for accurate object detection and semantic segmentation 閱讀筆記

Rich feature hierarchies for accurate object detection and semantic segmentation 0. 簡介本文是CVPR2014的論文，在這之前檢測最好的方法結合了low-lev

5、AFM（Attention+FM）-----Attentional Factorization Machines:Learning the Weight of Feature Interactions via Attention Network

factor eat .com 問題架構機器 tran 權重 machine 1、摘要：提出一個Attentional FM，Attention模型+因子分解機，其通過Attention學習到特征交叉的權重。因為很顯然不是所有的二階特征交互的重要性都是一樣的，如何

《A Discriminative Feature Learning Approach for Deep Face Recognition》論文筆記

1. 論文思想在這篇文章中尉人臉識別提出了一種損失函式，叫做center loss，在網路中加入該損失函式之後可以使得網路學習每類特徵的中心，懲罰每類的特徵與中心之間的距離。並且該損失函式是可訓練的，並且在CNN中容易優化。那麼，將center loss與softmax相結合會增加

論文筆記：Deep Attentive Tracking via Reciprocative Learning

Deep Attentive Tracking via Reciprocative Learning NIPS18_tracking Type:Tracking-By-Detection 本篇論文地主要創新是在將注意機制引入到目標跟蹤摘要：源自認知神經科學地視覺注意促進人類對相關的內

【人臉識別】A Discriminative Feature Learning Approach for Deep Face Recognition

一、理解 1、核心思想 2、論文效果 3、總結二、原文翻譯 1、abstract 卷積神經網路目前廣泛應用於計算機視覺領域，明顯地提高了state-of-the-art。在大多數可用的CNNs中，softmax損失函式被用作監督訊號以訓練深度模型。為了提高

PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metric Space 論文閱讀與實現

文章大意：本文主要面向空間點集的分類及語義分割問題，下面的討論與實現以語義分割為例進行介紹。下面是要解決的問題的示意圖：常見的2D語義分割問題一般的資料格式可能是語義邊界——如Polygon Annotation(多邊形（P

無監督特徵學習——Unsupervised feature learning and deep learning

無監督學習近年來很熱，先後應用於computer vision, audio classification和 NLP等問題，通過機器進行無監督學習feature得到的結果，其accuracy大多明顯優於其他方法進行training。本文將主要針對Andrew的unsuperv

A Discriminative Feature Learning Approach for Deep Face Recognition 原理及在caffe實驗復現

本文主要講centerloss 的原理，及其創新點。然後用caffe 跑自己的資料（CASIA-WebFace | MsCelebV1-Faces-Aligned） Reference paper：A Discriminative Feature

Playing Atari with Deep Reinforcement Learning

distrib xiv 遊戲模擬器 video value 行動 avi 動作 ade 這是一篇論文，原地址在： https://arxiv.org/abs/1312.5602 我屬於邊看便翻譯，邊理解，將他們記錄在這裏： Abstract：　　我們提出了第一個

Deep Reinforcement Learning

log min net pmi action algo 學習資源 blog adding Reinforcement Learning--David Silver http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Teaching.h

論文筆記之：Collaborative Deep Reinforcement Learning for Joint Object Search

region format es2017 join sid col str bottom respond Collaborative Deep Reinforcement Learning for Joint Object Search CVPR 2017 Motiva

Deep Residual Learning for Image Recognition

ant PE ear network sub cit test error inpu Kaiming HeXiangyu ZhangShaoqing RenMicrosoft Research {kahe, v-xiangz, v-shren, jiansun}@micr

強化學習（八）價值函數的近似表示與Deep Q-Learning

learning 步驟狀態更新任務 eva 學習 max wid 表示　　　　在強化學習系列的前七篇裏，我們主要討論的都是規模比較小的強化學習問題求解算法。今天開始我們步入深度強化學習。這一篇關註於價值函數的近似表示和Deep Q-Learning算法。　　　　De

強化學習（九）與Deep Q-Learning進階之Nature DQN

cal variable 模型基礎討論比較 .com 回放均方差　　　　在強化學習（八）價值函數的近似表示與Deep Q-Learning中，我們講到了Deep Q-Learning（NIPS 2013）的算法和代碼，在這個算法基礎上，有很多Deep Q-Lear

解讀continuous control with deep reinforcement learning（DDPG）

版權宣告：本文為博主原創文章，未經博主允許不得轉載。博主：shenshikexmu 聯絡方式：[email protected] 緣起 DDPG，是Google Deepmind第一篇關於連續動作的深度加強學習論文（是否第一篇存疑）。DQN（Deep Q Netw

【論文翻譯】ResNet論文中英對照翻譯--（Deep Residual Learning for Image Recognition）

【開始時間】2018.10.03 【完成時間】2018.10.05 【論文翻譯】ResNet論文中英對照翻譯--（Deep Residual Learning for Image Recognition）【中文譯名】深度殘差學習在影象識別中的應用【論文連結】https://arx

Deep Reinforcement Learning with Double Q-learning

轉載至：https://www.cnblogs.com/wangxiaocvpr/p/5620365.html Deep Reinforcement Learning with Double Q-learning Google DeepMind Abstract 　　主流的 Q-

深度學習方法（五）：卷積神經網路CNN經典模型整理Lenet，Alexnet，Googlenet，VGG，Deep Residual Learning

歡迎轉載，轉載請註明：本文出自Bin的專欄blog.csdn.net/xbinworld。技術交流QQ群：433250724，歡迎對演算法、技術感興趣的同學加入。關於卷積神經網路CNN，網路和文獻中有非常多的資料，我在工作/研究中也用了好一段時間各種常見的model了，就想著

"CapProNet: Deep Feature Learning via Orthogonal Projections onto Capsule Subspaces"閱讀筆記