Feed Forward and Backward Run in Deep Convolution Neural Network 論文閱讀筆記

阿新 • • 發佈：2018-11-24

徒手實現CNN：綜述論文詳解卷積網路的數學本質

Abstract

對卷積網路的數學本質和過程仍然不是太清楚，這也就是本論文的目的。

我們使用灰度圖作為輸入資訊影象，
ReLU 和 Sigmoid 啟用函式構建卷積網路的非線性屬性，
交叉熵損失函式用於計算預測值與真實值之間的距離。

1 Introduction

2 Architecture

這裡寫圖片描述

2.1 卷積層

reference
* [CNN學習筆記]http://blog.csdn.net/u010067397/article/details/78881614

卷積層是一組平行的特徵圖（feature map），它通過在輸入影象上滑動不同的卷積核並執行一定的運算而組成。
一張特徵圖中的所有元素都是通過一個卷積核計算得出的，也即一張特徵圖共享了相同的權重和偏置項。

這裡寫圖片描述

2.2 啟用函式

啟用函式定義了給定一組輸入後神經元的輸出。

這裡寫圖片描述

2.3 池化層

reference
深度學習筆記5：池化層的實現

池化層是指下采樣層，它把前層神經元的一個叢集的輸出與下層單個神經元相結合。
池化層有助於減少引數的數量並避免過擬合。

這裡寫圖片描述

2.4 全連線層

2.5 損失函式

損失函式用於測量模型效能以及實際值 y_i 和預測值 y hat 之間的不一致性。

這裡寫圖片描述

2.5.1 均方誤差

MSE 不好的地方在於，當它和 Sigmoid 啟用函式一起出現時，可能會出現學習速度緩慢（收斂變慢）的情況。

這裡寫圖片描述

2.5.2 Mean Squared Logarithmic Error

這裡寫圖片描述

2.5.3 L2 Loss function

這裡寫圖片描述

2.5.4 L1 Loss function

這裡寫圖片描述

2.5.5 Mean Absolute Error

這裡寫圖片描述

2.5.6 Mean Absolute Percentage Error

這裡寫圖片描述

缺點：對於類標為0的點不能用。

2.5.7 交叉熵

最為普遍使用的損失函式是交叉熵。
交叉熵代價函式(損失函式)及其求導推導

這裡寫圖片描述

3 卷積網路的學習

3.1 前饋推斷過程

這裡寫圖片描述

卷積網路的前饋傳播過程可以從數學上解釋為將輸入值與隨機初始化的權重相乘，然後每個神經元再加上一個初始偏置項，最後對所有神經元的所有乘積求和以饋送到啟用函式中，啟用函式對輸入值進行非線性變換並輸出啟用結果。

這裡寫圖片描述

I 為影象， K為卷積核。

這裡寫圖片描述

3.2 反饋過程

reference
神經網路之梯度下降與反向傳播（上）
神經網路之梯度下降與反向傳播（下）

一下推導都是0-1預測

在反饋的過程中，損失函式的梯度計算：最後一層的首先計算，第一層的最後計算。
一個層的偏導數在計算另一個層的時由於鏈式法則會被重用，這使得計算梯度在每一層更加有效。
模型的表現隨著Loss的減小而變得更好。

在反饋的過程中，我們需要更新 W, b，K這些引數。

這裡寫圖片描述

對最後一層偏導數，也就是輸出求導

這裡寫圖片描述

對 W 求導

這裡寫圖片描述

4 Conclusion

我們介紹了CNN結構，包括各種啟用函式，損失函式。
一步一步解釋前饋和反饋過程。
為了數學公式的方便，我們使用灰度圖、卷積核步長設定為1，補邊為0，使用非線性形式在中間層，最後一層使用ReLU和sigmoid啟用函式。
使用交叉熵評估模型。
大量優化和正則方式最小化損失，增加學習率或者避免過擬合
本文嘗試使用數學角度解釋CNN。

Feed Forward and Backward Run in Deep Convolution Neural Network 論文閱讀筆記

徒手實現CNN：綜述論文詳解卷積網路的數學本質 Abstract 對卷積網路的數學本質和過程仍然不是太清楚，這也就是本論文的目的。我們使用灰度圖作為輸入資訊影象， ReLU 和 Sigmoid 啟用函式構建卷積網路的非線性屬性，交叉熵損失函式用於計算

論文筆記《The application of two-level attention models in deep convolutional neural network for FGVC》

這篇文章是2015年的，作者使用提出了兩級注意力的方法，來進行細粒度分類。以鳥類分類為例。作者在object-level和part-level兩個級別分別對鳥進行分類，將得到的分數相加綜合後得到最後的分類結果。上圖是鳥分類在object-level的一個流程圖，先用select

Highly Efficient Forward and Backward Propagation of Convolutional Neural Networks for Pixelwise Cla

eliminate all the redundant computation in convolution and pooling on images by introducing novel d-regularly sparse kernels. It generates exactly the sam

論文閱讀筆記 DeepLabv1：SEMANTIC IMAGE SEGMENTATION WITH DEEP CONVOLUTIONAL NETS AND FULLY CONNECTED CRFS

bar pro 依賴性後處理主題處理分配位置平滑論文鏈接：https://arxiv.org/abs/1412.7062 摘要該文將DCNN與概率模型結合進行語義分割，並指出DCNN的最後一層feature map不足以進行準確的語義分割

【論文閱讀筆記】Deep Learning based Recommender System: A Survey and New Perspectives

【論文閱讀筆記】Deep Learning based Recommender System: A Survey and New Perspectives 2017年12月04日 17:44:15 cskywit 閱讀數：1116更多個人分類：機器學習

論文閱讀筆記二十四：Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition（SPPNet CVPR2014）

分享圖片介紹 bin con strong map com 提高 https 論文源址：https://arxiv.org/abs/1406.4729 tensorflow相關代碼：https://github.com/peace195/sppnet 摘要

Spark MLlib Deep Learning Convolution Neural Network (深度學習-卷積神經網路)3.3

3、Spark MLlib Deep Learning Convolution Neural Network(深度學習-卷積神經網路)3.3 第三章Convolution Neural Network (卷積神經網路) 3例項 3.1 測試資料按照上例資料，或者新建圖片

論文解析《Deep Convolutional Neural Network Features and the Original Image》

這一篇論文詳細分析了人臉識別中CNN網路提取到的features有一些什麼樣的性質，一般人臉識別中CNN出來後面接一個線性層用交叉熵來分類，這裡的features值得就是cnn出來的512或者128維的浮點陣列。文章首先用這個features作為輸入，使用LDA來分類，預測頭

HYPERSPECTRAL IMAGE CLASSIFICATION USING TWOCHANNEL DEEP CONVOLUTIONAL NEURAL NETWORK閱讀筆記

數據 eight 說明 enter 像素點維數 tran vertica 通用 HYPERSPECTRAL IMAGE CLASSIFICATION USING TWOCHANNEL DEEP CONVOLUTIONAL NEURAL NETWORK 論文地址：h

論文閱讀筆記（十一）Network In Network

hole orm 後來 entropy function ppr master 3層上進該論文提出了一種新穎的深度網絡結構，稱為“Network In Network”(NIN)，以增強模型對感受野內local patches的辨別能力。與傳統的CNNs相比，NIN主要

DensePose:Dense Human Pose Estimation In The Wild 論文閱讀筆記

一、本文主要是Facebook AI 和INRIA 聯合出品，基於RCNN架構，以及Mask RCNN的多工結構，開源http://densepose.org 二、主要工作分為三點 1：標註了一個新的資料集，基於coco資料集，增加了u

《AppIntent - Analyzing Sensitive Data Transmission in Android for Privacy Leakage Detection》論文閱讀筆記

AppIntent: Analyzing Sensitive Data Transmission in Android for Privacy Leakage Detection APPIntent:分析敏感資料傳播在Android裝置中隱私洩露的檢測文獻引

論文閱讀筆記十八：ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation

每一個內核基於 proc vgg 包含 rep 重要偏差論文源址：https://arxiv.org/abs/1606.02147 tensorflow github: https://github.com/kwotsin/TensorFlow-ENet 摘要

《Understanding Convolution for Semantic Segmentation》論文閱讀筆記

語義分割–Understand Convolution for Semantic Segmentation 動機 1. 編碼部分的問題對於編碼部分，空洞卷積由於其可以增大感受野、控制解析度從而消除了下采樣的需要。但是空洞卷積固有的問題就是gridd

蒸餾神經網路(Distill the Knowledge in a Neural Network) 論文筆記蒸餾神經網路(Distill the Knowledge in a Neural Network) 論文筆記

轉蒸餾神經網路(Distill the Knowledge in a Neural Network) 論文筆記 2017年08月06日 16:19:48 haoji00

MSCNN論文解讀-A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection

多尺度深度卷積神經網路進行快速目標檢測：兩階段目標檢測器，與faster-rcnn相似，分為an object proposal network and an accurate detection network. 文章主要解決的是目標大小不一致的問題，尤其是對小目標的檢測，通過多

論文閱讀筆記《Gated Context Aggregation Network for Image Dehazing and Deraining》WACV19

輸出每一個為什麽作用導致作者 ont 而不是簡單的目錄：相關鏈接方法亮點方法細節實驗結果總結與收獲相關鏈接：論文：https://arxiv.org/abs/1811.08747 源碼：暫無方法亮點：提出端到端的去霧網絡，不

論文閱讀筆記二十二：Learning to Segment Instances in Videos with Spatial Propagation Network（CVPR-20017）

論文源址：https://arxiv.org/abs/1709.04609 摘要該文提出了基於深度學習的例項分割框架，主要分為三步，（1）訓練一個基於ResNet-101的通用模型，用於分割影象中的前景和背景。（2）將通用模型進行微調成為一個例項分割模型，藉

論文閱讀筆記二十三：Rich feature hierarchies for accurate object detection and semantic segmentation Tech report(R-CNN CVPR2014)

論文源址：http://www.cs.berkeley.edu/~rbg/#girshick2014rcnn 摘要在PASCAL VOC資料集上，最好的方法的思路是將低階資訊與較高層次的上下文資訊進行結合。該文的兩個亮點：（1）將CNN應用到re

論文閱讀筆記二十九：One pixel attack for fooling deep neural networks（CVPR2017）

論文源址：https://arxiv.org/abs/1710.08864 tensorflow程式碼: https://github.com/Hyperparticle/one-pixel-attack-keras 摘要

Feed Forward and Backward Run in Deep Convolution Neural Network 論文閱讀筆記

Abstract

1 Introduction

2 Architecture

2.1 卷積層

2.2 啟用函式

2.3 池化層

2.4 全連線層

2.5 損失函式

2.5.1 均方誤差

2.5.2 Mean Squared Logarithmic Error

2.5.3 L2 Loss function

2.5.4 L1 Loss function

2.5.5 Mean Absolute Error

2.5.6 Mean Absolute Percentage Error

2.5.7 交叉熵

3 卷積網路的學習

3.1 前饋推斷過程

3.2 反饋過程

4 Conclusion

相關推薦