卷積神經網路（CNN）之一維卷積、二維卷積、三維卷積詳解

阿新 • • 發佈：2018-12-14

由於計算機視覺的大紅大紫，二維卷積的用處範圍最廣。因此本文首先介紹二維卷積，之後再介紹一維卷積與三維卷積的具體流程，並描述其各自的具體應用。

1. 二維卷積

圖中的輸入的資料維度為14×1414×14，過濾器大小為5×55×5，二者做卷積，輸出的資料維度為10×1010×10（14−5+1=1014−5+1=10）。如果你對卷積維度的計算不清楚，可以參考我之前的部落格吳恩達深度學習筆記（deeplearning.ai）之卷積神經網路（CNN）（上）。
上述內容沒有引入channel的概念，也可以說channel的數量為1。如果將二維卷積中輸入的channel的數量變為3，即輸入的資料維度變為（14×14×314×14×3）。由於卷積操作中過濾器的channel數量必須與輸入資料的channel數量相同

，過濾器大小也變為5×5×35×5×3。在卷積的過程中，過濾器與資料在channel方向分別卷積，之後將卷積後的數值相加，即執行10×1010×10次3個數值相加的操作，最終輸出的資料維度為10×1010×10。
以上都是在過濾器數量為1的情況下所進行的討論。如果將過濾器的數量增加至16，即16個大小為10×10×310×10×3的過濾器，最終輸出的資料維度就變為10×10×1610×10×16。可以理解為分別執行每個過濾器的卷積操作，最後將每個卷積的輸出在第三個維度（channel 維度）上進行拼接。
二維卷積常用於計算機視覺、影象處理領域。

2. 一維卷積

圖中的輸入的資料維度為8，過濾器的維度為5。與二維卷積類似，卷積後輸出的資料維度為8−5+1=48−5+1=4。
如果過濾器數量仍為1，輸入資料的channel數量變為16，即輸入資料維度為8×168×16。這裡channel的概念相當於自然語言處理中的embedding，而該輸入資料代表8個單詞，其中每個單詞的詞向量維度大小為16。在這種情況下，過濾器的維度由55變為5×165×16，最終輸出的資料維度仍為44。
如果過濾器數量為nn，那麼輸出的資料維度就變為4×n4×n。
一維卷積常用於序列模型，自然語言處理領域。

3. 三維卷積

這裡採用代數的方式對三維卷積進行介紹，具體思想與一維卷積、二維卷積相同。

假設輸入資料的大小為a1×a2×a3a1×a2×a3，channel數為cc，過濾器大小為ff，即過濾器維度為f×f×f×cf×f×f×c（一般不寫channel的維度），過濾器數量為nn。
基於上述情況，三維卷積最終的輸出為(a1−f+1)×(a2−f+1)×(a3−f+1)×n(a1−f+1)×(a2−f+1)×(a3−f+1)×n。該公式對於一維卷積、二維卷積仍然有效，只有去掉不相干的輸入資料維度就行。
三維卷積常用於醫學領域（CT影響），視訊處理領域（檢測動作及人物行為）。

卷積神經網路（CNN）之一維卷積、二維卷積、三維卷積詳解

由於計算機視覺的大紅大紫，二維卷積的用處範圍最廣。因此本文首先介紹二維卷積，之後再介紹一維卷積與三維卷積的具體流程，並描述其各自的具體應用。 1. 二維卷積圖中的輸入的資料維度為14×1414×14，過濾器大小為5×55×5，二者做卷積，輸出的資料維度為10×1

卷積神經網路（CNN）在語音識別中的應用

卷積神經網路（CNN）在語音識別中的應用作者：侯藝馨前言總結目前語音識別的發展現狀，dnn、rnn/lstm和cnn算是語音識別中幾個比較主流的方向。2012年，微軟鄧力和俞棟老師將前饋神經網路FFDNN（Feed Forward Deep Neural Network）引入到聲學模

卷積神經網路（CNN）_相關知識

斯坦福公開課 CS231n Convolutional Neural Networks for Visual Recognition ： http://cs231n.stanford.edu/syllabus.html 網路引數初始化：https://www.cnblogs.com/yinheyi

卷積神經網路（CNN）一之概念原理

　　什麼是卷積神經網路呢？這個的確是比較難搞懂的概念，特別是一聽到神經網路，大家腦海中第一個就會想到複雜的生物學，讓人不寒而慄，那麼複雜啊．卷積神經網路是做什麼用的呢？它到底是一個什麼東東呢？卷積神經網路的靈感源一種生物程序，其中神經元之間的聯結模式和動物視覺皮層組織非常相似。所以發明者把它叫做卷積神經網

【6年人工智慧開發】簡述卷積神經網路（CNN）

在百度做了6年人工智慧方面的程式設計開發，也有很多這方面的經驗吧，從古至今，機器人一直承載著人類巨大的夢想。隨著各類感測器、語音互動、機器識別、SLAM等技術的蓬勃發展，機器人開始從科幻作品中走出

卷積神經網路（CNN）基礎

CNN的基本結構原文地址：https://www.jianshu.com/p/da0c4cc76a06 CNN分為幾層 CNN一共有卷積層（CONV）、ReLU層（ReLU）、池化層（Pooling）、全連線層（FC（Full Connection））下面是各個層的

吳恩達深度學習筆記（deeplearning.ai）之卷積神經網路（CNN）（上）

1. Padding 在卷積操作中，過濾器（又稱核）的大小通常為奇數，如3x3，5x5。這樣的好處有兩點：在特徵圖（二維卷積）中就會存在一箇中心畫素點。有一箇中心畫素點會十分方便，便於指出過濾器的位置。在沒有padding的情況下，經過卷積操作，輸出的資

深入學習卷積神經網路（CNN）的原理知識

　　網上關於卷積神經網路的相關知識以及數不勝數，所以本文在學習了前人的部落格和知乎，在別人部落格的基礎上整理的知識點，便於自己理解，以後複習也可以常看看，但是如果侵犯到哪位大神的權利，請聯絡小編，謝謝。好了下面言歸正傳：　　在深度學習領域中，已經經過驗證的成熟演算法，目前主要有深度卷積網路（DNN）和遞迴網

簡單介紹卷積神經網路（CNN）

前言：原創： Python開發者內容取自公眾號——Python開發者，有興趣的可以關注一下什麼是卷積神經網路，它為何重要？卷積神經網路（也稱作 ConvNets 或 CNN）是神經網路的一種，它在影象識別和分類等領域已被證明非常有效。卷積神經網路除了為機器人

Deep learning with Theano 官方中文教程（翻譯）（四）—— 卷積神經網路（CNN）

供大家相互交流和學習，本人水平有限，若有各種大小錯誤，還請巨牛大牛小牛微牛們立馬拍磚，這樣才能共同進步！若引用譯文請註明出處http://www.cnblogs.com/charleshuang/。文章中的程式碼截圖不是很清晰，可以去上面的原文網址去檢視。 1、動機卷積神經網路（CNN

卷積神經網路（CNN）相關知識以及數學推導

神經網路概述神經元模型以上就是經典的“M-P神經元模型”。在這個模型中，神經元接收來自n個其他神經元傳遞過來的輸入訊號，這些輸入訊號通過帶權重的連線進行傳遞，神經元接收到的總輸入值將於神經元的閾值進行比較，然後通過“啟用函式”處理以產生神經元

機器學習13：卷積神經網路（CNN）

一、Why CNN for Image？ 1、對於一幅影象來說，用DNN全連線的話，引數會很多，而影象實際上是有很多冗餘的，有些地方的特徵可能不需要。而CNN其實是拿掉了DNN的一些引數。 2、識別工作中，有時候並不需要看整張圖，而只需要看部分位置如鳥嘴。不管鳥嘴出現在影象的哪個位置，

tensorflow 學習專欄（六）：使用卷積神經網路（CNN）在mnist資料集上實現分類

卷積神經網路（Convolutional Neural Network, CNN）是一種前饋神經網路，它的人工神經元可以響應一部分覆蓋範圍內的周圍單元，對於大型影象處理有出色表現。卷積神經網路CNN的結構一般包含這幾個層：輸入層：用於資料的輸入卷積層：使用卷積核進行特徵提取和

深度學習基礎（二）—— 從多層感知機（MLP）到卷積神經網路（CNN）

經典的多層感知機（Multi-Layer Perceptron）形式上是全連線（fully-connected）的鄰接網路（adjacent network）。 That is, every neuron in the network is connec

乾貨 | 深度學習之卷積神經網路（CNN）的前向傳播演算法詳解

微信公眾號關鍵字全網搜尋最新排名【機器學習演算法】：排名第一【機器學習】：排名第一【Python】：排名第三【演算法】：排名第四前言在（乾貨 | 深度學習之卷積神經網路(CNN)的模型結構）中，我們對CNN的模型結構做了總結，這裡我們就在CNN的模型基礎上，看看CNN的前向傳播演算法是什麼樣

大話卷積神經網路（CNN）

—— 原文釋出於本人的微信公眾號“大資料與人工智慧Lab”（BigdataAILab），歡迎關注。這幾年深度學習快速發展，在影象識別、語音識別、物體識別等各種場景上取得了巨大的成功，例如AlphaGo擊敗世界圍棋冠軍，iPhone X內建了人臉識別解鎖功能等等，很多AI產品在

【深度學習】卷積神經網路（CNN）

卷積神經網路（Convolutional Neural NetWork，CNN）：自然語言處理、醫藥發現、災難氣候發現、人工智慧程式。輸入層：整個神經網路的輸入卷積層：卷積神經網路中最重要的部分，卷積層中每一個節點的輸入只是上一層神經網路的一小塊，一般為3

卷積神經網路（CNN）在無人駕駛中的應用

無人駕駛的感知部分作為計算機視覺的領域範圍，也不可避免地成為CNN發揮作用的舞臺。本文是無人駕駛技術系列的第八篇，深入介紹CNN（卷積神經網路）在無人駕駛3D感知與物體檢測中的應用。 CNN簡介卷積神經網路（Convolutional Neural Network，CNN）是一種適合使用在連續值輸入訊號上

14種模型設計幫你改進你的卷積神經網路（CNN）

摘要：這14 種原創設計模式可以幫助沒有經驗的研究者去嘗試將深度學習與新應用結合，對於那些沒有機器學習博士學位的人來說是一個很好的起點。自2011年以來，深度卷積神經網路（CNN）在影象分類的工作中的表現就明顯優於人類，它們已經成為在計算機視覺領域的一種標準，如影象

第五章卷積神經網路（CNN）

第五章卷積神經網路（CNN）標籤（空格分隔）：深度學習 5.1 卷積神經網路的組成層在卷積神經網路中，有3種最主要的層：卷積運算層池化層全連線層一個完整的神經網路就是由這三種層疊加組成的。結構

卷積神經網路（CNN）之一維卷積、二維卷積、三維卷積詳解

1. 二維卷積

2. 一維卷積

3. 三維卷積

相關推薦