深度學習（二）卷積計算

阿新 • • 發佈：2018-12-07

寫在前面：所有關於深度學習的基礎知識均為鄙人的筆記分享，很多內容摘自大神們的部落格或論文，因時間太長記不清了分別來自哪裡。若有侵權，請聯絡鄙人郵箱[email protected]

目前，卷積的計算大多采用間接計算的方式，主要有以下三種實現方式：

im2col + GEMM。 caffe等很多框架中都使用了這種計算方式，原因是將問題轉化為矩陣乘法後可以方便的使用很多矩陣運算庫（如MKL、openblas、Eigen等）。
FFT變換。時域卷積等於頻域相乘，因此可將問題轉化為簡單的乘法問題。
Winograd。這種不太熟悉，據說在GPU上效率更高。 NNPACK就是FFT和Winograd方法的結合。

上面三種方法執行效率都還不錯，但對記憶體佔用比較高，因為需要儲存中間結果或者臨時輔助變數。

im2col + GEMM 原理

darknet中應用了與caffe一樣的函式

下面傳有兩個動圖形象說明

å·ç§¯ç¥ç»ç½ç»

注意！！！！：

1 多通道多卷積操作計算過程

如圖5，輸入影象layer m-1有4個通道，同時有2個卷積核w1和w2。對於卷積核w1，先在輸入影象4個通道分別作卷積，再將4個通道結果加起來得到w1的卷積輸出；卷積核w2類似。所以對於某個卷積層，無論輸入影象有多少個通道，輸出影象通道數總是等於卷積核數量！

縮排對多通道影象做1x1卷積，其實就是將輸入影象於每個通道乘以卷積係數後加在一起，即相當於把原影象中本來各個獨立的通道“聯通”在了一起。

2 卷積核計算過程

1、首先，假設輸入圖片大小是 224*224*3（224是影象寬或高，3是三個通道，也就是RGB三種）

2、然後，假設conv1層的是 7*7*96 （7*7是卷積核的size k，96是卷積核的個數n），stride = 2；

3、所以conv1得到的結果是110*110*96（[(w-k+pad)/stride+1] * [(h-k+pad)/stride+1] * n）（這個110來自於 (224-7+pad)/2+1 = 110

，這個pad是我們常說的填充，也就是在圖片的周圍補充畫素，這樣做的目的是為了能夠整除，除以2是因為2是圖中的stride）；

4、再做一次池化pooling，得到pool1，池化的核的大小是3*3，所以池化後圖片的維度是55*55*96 （ (110-3+pad)/2 +1 =55 ）；

深度學習（二）卷積計算

寫在前面：所有關於深度學習的基礎知識均為鄙人的筆記分享，很多內容摘自大神們的部落格或論文，因時間太長記不清了分別來自哪裡。若有侵權，請聯絡鄙人郵箱[email protected] 目前，卷積的計算大多采用間接計算的方式，主要有以下三種實現方式： im2col + GEMM。

機器學習與深度學習系列連載：第二部分深度學習（十）卷積神經網路 1 Convolutional Neural Networks

卷積神經網路 Convolutional Neural Networks 卷積神經網路其實早在80年代，就被神經網路泰斗Lecun 提出[LeNet-5, LeCun 1980]，但是由於當時的資料量、計算力等問題，沒有得到廣泛使用。卷積神經網路的靈感來自50年代的諾貝爾生物學獎

深度學習（四）卷積神經網路入門學習(1)

卷積神經網路入門學(1)作者：hjimce卷積神經網路演算法是n年前就有的演算法，只是近年來因為深度學習相關演算法為多層網路的訓練提供了新方法，然後現在電腦的計算能力已非當年的那種計算水平，同時現在的訓練資料很多，於是神經網路的相關演算法又重新火了起來，因此卷積神經網路就又活

深度學習1——深度學習（四）卷積神經網路入門學習(1)

卷積神經網路入門學(1) 轉載自：hjimce的專欄 - 部落格頻道 - CSDN.NET 原文地址：http://blog.csdn.NET/hjimce/article/details/47323463 作者：hjimce 卷積

深度學習（四）卷積神經網路Lenet-5實現

卷積神經網路Lenet-5實現作者：hjimce 卷積神經網路演算法是n年前就有的演算法，只是近年來因為深度學習相關演算法為多層網路的訓練提供了新方法，然後現在電腦的計算能力已非當年的那種計算水平，同時現在的訓練資料很多，於是神經網路的相關演算法

深度學習（二）Back Propagation Network

發展史人們一直在探索想演算法來模擬生物神經系統的組織機能，各個年代對於這一課題的研究也是幾經沉浮、命運多舛，也正如此它的強大之處在演算法中一直被追求，生物神經元到感知器 &

深度學習（二）——從零自己製作資料集到利用deepNN實現誇張人臉表情的實時監測（tensorflow實現）

一、背景介紹這篇文章主要參考我的上一篇文章：深度學習（一）——deepNN模型實現攝像頭實時識別人臉表情（C++和python3.6混合程式設計）。由於上一篇文章的模型所採用的資料集為fer2013，前面也介紹過這個基於這個資料集的模型識別人臉表情的準確率大概在70%左右

深度學習（二）損失函式與梯度

文章目錄損失函式梯度 25天看完了吳恩達的機器學習以及《深度學習入門》和《tensorflow實戰》兩本書，吳恩達的學習課程只學了理論知識，另外兩本書的程式碼自己敲了一遍，感覺過的太快，趁著跑cGAN的時間把兩本書的知識點總結下，然後繼續深度

人工智慧實踐：TensorFlow筆記學習（七）—— 卷積神經網路基礎

大綱7.1 卷積神經網路7.2 lenet5程式碼講解目標掌握卷積神經網路的搭建方法7.1 卷積神經網路全連線 NN：每個神經元與前後相鄰層的每一個神經元都有連線關係，輸入是特徵，輸出為預測的結果。引數個數：（前層X後層+後層）一張解析度僅僅是28x28的黑白影象，就有

深度學習（二）theano環境搭建

theano環境搭建作者：hjimce 搭建theano實屬不易，因為每個人的電腦不一樣，所以安裝過程會有所區別，特別是安裝cuda的時候，很容易驅動衝突。網上教程一大堆，但是我都沒搭建成功，最後根據官網的教程，一步一步的琢磨，總算功夫不負有心人。因此寫一下艱辛的the

系統學習深度學習（二） --自編碼器，DA演算法，SDA，稀疏自編碼器

轉自：http://www.cnblogs.com/neopenx/p/4370350.html，作者寫的很好，輕鬆易懂。起源：PCA、特徵提取.... 隨著一些奇怪的高維資料出現，比如影象、語音，傳統的統計學-機器學習方法遇到了前所未有的挑戰。資料維度過高，資料單

機器學習與深度學習系列連載：第二部分深度學習（十二）卷積神經網路 3 經典的模型（LeNet-5，AlexNet ，VGGNet，GoogLeNet，ResNet）

卷積神經網路 3 經典的模型經典的卷積神經網路模型是我們學習CNN的利器，不光是學習原理、架構、而且經典模型的超引數、引數，都是我們做遷移學習最好的源材料之一。 1. LeNet-5 [LeCun et al., 1998] 我們還是從CNN之父，LeCun大神在98年提出的模

深度學習（二十七）視覺化理解卷積神經網路（反池化 pooling unpooling）

本篇博文主要講解2014年ECCV上的一篇經典文獻：《Visualizing and Understanding Convolutional Networks》，可以說是CNN領域視覺化理解的開山之作，這篇文獻告訴我們CNN的每一層到底學習到了什麼特徵，然後作者通過視覺化進行調整網路，提高了精度。最近兩年深層

深度學習（二十七）視覺化理解卷積神經網路

視覺化理解卷積神經網路作者：hjimce一、相關理論本篇博文主要講解2014年ECCV上的一篇經典文獻：《Visualizing and Understanding Convolutional Netw

DeepLearning.ai學習筆記（四）卷積神經網絡 -- week2深度卷積神經網絡實例探究

過濾 common 經典上一個問題 inline 最壞情況 ali method 一、為什麽要進行實例探究？通過他人的實例可以更好的理解如何構建卷積神經網絡，本周課程主要會介紹如下網絡 LeNet-5 AlexNet VGG ResNet (有152層) Incep

吳恩達【深度學習工程師】 04.卷積神經網絡第三周目標檢測（1）基本的對象檢測算法

元素需要有關卷積訓練特定步長來看選擇該筆記介紹的是《卷積神經網絡》系列第三周：目標檢測（1）基本的對象檢測算法主要內容有： 1.目標定位 2.特征點檢測 3.目標檢測目標定位使用算法判斷圖片中是不是目標物體，如果是還要再圖片中標出其位置並

卷積神經網絡學習（二）

pooling ssis font mat play mathjax con 變換 AD 一、基礎知識（一）　　filter: 　　　　　　　　padding:在圖像卷積操作之前，沿著圖像邊緣用0進行圖像填充。padding會影響輸出圖像大小。　　stride(卷積

吳恩達《深度學習》第四門課（1）卷積神經網絡

圖像分割 1.5 共享信號處理 soft 沒有樣本填充單元 1.1計算機視覺（1）計算機視覺的應用包括圖像分類、目標檢測、圖像分割、風格遷移等，下圖展示了風格遷移案例：（2）圖像的特征量非常之大，比如一個3通道的1000*1000的照片，其特征為3*1000*

吳恩達《深度學習》第四門課（2）卷積神經網絡：實例探究

之一所有展示數據擴充簡介設置假設通道開源 2.1為什麽要進行實例探究（1）就跟學編程一樣，先看看別人怎麽寫的，可以模仿。（2）在計算機視覺中一個有用的模型，，用在另一個業務中也一般有效，所以可以借鑒。（3）本周會介紹的一些卷積方面的經典網絡經典的包括：

深度學習（9）——無監督語義分割之全卷積域適應網路（譯文）

無監督語義分割之全卷積域適應網路摘要深度神經網路的最新進展令人信服地證明了在大型資料集上學習視覺模型的高能力。然而，收集專家標記的資料集尤其是畫素級註釋是一個非常昂貴的過程。一個吸引人的選擇是渲染合成數據（例如，計算機遊戲）並自動生成基礎事實。然而，簡單地

深度學習（二）卷積計算

相關推薦