深度學習筆記-卷積神經網路CNN與迴圈神經網路RNN有什麼區別？

阿新 • • 發佈：2019-01-08

CNN與RNN本質的不同就是所基於的假設不同，由於核心假設的不同，導致實現方式的差異。

CNN

首先理解什麼叫做卷積，或者說為什麼要翻譯為卷積神經網路。

卷積的定義：https://baike.baidu.com/item/%E5%8D%B7%E7%A7%AF/9411006?fr=aladdin

簡單來說，卷積就是兩個相對運動的幾何圖形，在相交到相離之間，重疊的面積。

對於CNN神經網路，有一個基礎的假設——人類的視覺總是會關注視線內特徵最明顯的點

而CNN神經網路是模仿人類處理資訊的過程，我們首先來看一下人類處理資訊的幾個特點。

1）從空間頻率域來看，人眼是一個低通型線性系統，即人眼受幾何尺寸和視覺細胞大小的影響，人眼對太高的頻率不敏感。

2) 人眼對亮度訊號的空間分別率大於對色度訊號的空間解析度。

3) 由於人眼受神經系統的調節，從空間頻率的角度來說，人眼又具有帶通性線性系統的特性。由訊號分析的理論可知，人眼視覺系統對訊號進行加權求和運算，相當於使訊號通過一個帶通濾波器，結果會使人眼產生一種邊緣增強感覺——側抑制效應。

4）影象的邊緣資訊對視覺很重要，特別是邊緣的位置資訊。

5）人眼的視覺掩蓋效應使一種區域性效應，受背景照度，紋理複雜性和訊號頻率的影響。具有不同區域性特性的區域，在保證不被人眼察覺的前提下，允許改變的訊號強度不同。人眼的視覺特性是一個多通道模型。

總結來說就是，人眼對明顯的特徵最敏感，人眼解析食物的時候，相當於用濾鏡掃過影象。

CNN正是利用了這樣的一種特性，來掃描並記錄圖片資訊。

首先生成一個濾鏡，並對影象整體進行掃描過濾，通過這個濾鏡filter解析，得到很多個掃描後的圖片分支結果。

（圖片來源https://en.wikipedia.org/wiki/Convolutional_neural_network#/media/File:Typical_cnn.png）

上圖中的convolutions 就是在進行影象疊加濾鏡掃描，得到一系列結果的工作。

接下來，在得到一系列卷積之後的結果後，我們進行特徵的提取，也就是上圖中的subsampling。

（圖片來源https://en.wikipedia.org/wiki/Convolutional_neural_network）

這裡有個max pool的概念，也就是提取每個小特徵當中，值最大的那個。（值越大說明特徵越明顯，越符合上文說的人眼特性）

通過不停的特徵抽取，得到最後的結果，如果這個結果與我們的預期不符，則計算誤差值，反饋給每一層的卷積網路，進行微調整，再重複上面的步驟。

CNN過程中，對於邊界值的處理。

第一種是在邊界之外填充0，以保證濾鏡可以像多次掃過中間值一樣的掃過邊界值。但是這樣做容易產生噪聲（後新增進去的值）。

第二種是邊界停止，即濾鏡邊緣觸碰到圖片邊界就認為這一側過濾結束。

RNN

RNN的假設——事物的發展是按照時間序列展開的，即前一刻發生的事物會對未來的事情的發展產生影響。

所以，在處理過程中，每一刻的輸出都是帶著之前輸出值加權之後的結果。

（圖片來源 http://d3kbpzbmcynnmx.cloudfront.net/wp-content/uploads/2015/09/rnn.jpg）

公式表示t時刻的輸出：

$s_t=f(Ux_t + Ws_{t-1})$

st為當前時刻的輸出，xt為當前時刻的輸入，U為當前時刻輸入值的加權計算，st-1為上一時刻的輸出，W為上一時刻輸出的權重。

通過這樣的計算方式，我們可以認為，當前的結果包含之前的結果，或者說受到之前結果的影響。

但是，RNN對於短期記憶的模型效果很好，卻無法進行長期記憶的輸出，因為權重累加過於龐大，可能導致結果失真、運算效率低下。

所以LSTM應運而生。

（圖片來源https://en.wikipedia.org/wiki/Long_short-term_memory#/media/File:Peephole_Long_Short-Term_Memory.svg）

整個單元內主要包含異或門和與門。

1 異或 1 = 0 認為是相同的資訊，捨棄

1 與 0 = 1 將不同的資訊疊加

通過這兩部運算就能減少我們的資料量，將重複資訊遺忘，將未知資訊記錄下來，將結果更新之後，再輸出。

深度學習筆記-卷積神經網路CNN與迴圈神經網路RNN有什麼區別？

CNN與RNN本質的不同就是所基於的假設不同，由於核心假設的不同，導致實現方式的差異。 CNN 首先理解什麼叫做卷積，或者說為什麼要翻譯為卷積神經網路。卷積的定義：https://baike.baidu.com/item/%E5%8D%B7%E7%A7%AF/94110

深度學習筆記——卷積神經網路

程式碼參考了零基礎入門深度學習(4) - 卷積神經網路這篇文章，我只對程式碼裡可能存在的一些小錯誤進行了更改。至於卷積神經網路的原理以及程式碼裡不清楚的地方可以結合該文章理解，十分淺顯易懂。 import numpy as np from functools import reduce fro

Google 深度學習筆記卷積神經網路

Convolutional Networks deep dive into images and convolutional models Convnet BackGround 人眼在識別影象時，往往從區域性到全域性區域性與區域性之間聯絡

深度學習：卷積神經網路CNN入門

該文是，並假設你理解前饋神經網路。目錄視覺感知畫面識別是什麼識別結果取決於什麼影象表達畫面識別的輸入畫面不變形前饋神經網路做畫面識別的不足卷積神經網路做畫面識別區域性連線空間共享輸出空間表達Depth維的處理Zero padding形狀、概念抓取多filte

【深度學習】卷積神經網路CNN基本知識點

卷積神經網路與前面學的常規神經網路很相似，也有輸入、權重、偏差、損失函式、啟用函式、全連線層等概念，之前的一些小的技巧也仍然適用。與常規神經網路的對比卷積神經網路（Convolutional Neural Networks，CNNs / ConvNe

深度學習之卷積神經網路CNN及tensorflow程式碼實現示例詳細介紹

一、CNN的引入在人工的全連線神經網路中，每相鄰兩層之間的每個神經元之間都是有邊相連的。當輸入層的特徵維度變得很高時，這時全連線網路需要訓練的引數就會增大很多，計算速度就會變得很慢，例如一張黑白的 28×28 的手寫數字圖片，輸入層的神經元就有784個，如下圖所示：

乾貨 | 深度學習之卷積神經網路（CNN）的前向傳播演算法詳解

微信公眾號關鍵字全網搜尋最新排名【機器學習演算法】：排名第一【機器學習】：排名第一【Python】：排名第三【演算法】：排名第四前言在（乾貨 | 深度學習之卷積神經網路(CNN)的模型結構）中，我們對CNN的模型結構做了總結，這裡我們就在CNN的模型基礎上，看看CNN的前向傳播演算法是什麼樣

深度學習之卷積神經網路CNN及tensorflow程式碼實現示例

一、CNN的引入在人工的全連線神經網路中，每相鄰兩層之間的每個神經元之間都是有邊相連的。當輸入層的特徵維度變得很高時，這時全連線網路需要訓練的引數就會增大很多，計算速度就會變得很慢，例如一張黑白的 28×28 的手寫數字圖片，輸入層的神經元就有784個，如下圖

乾貨 | 深度學習之卷積神經網路(CNN)的模型結構

微信公眾號關鍵字全網搜尋最新排名【機器學習演算法】：排名第一【機器學習】：排名第一【Python】：排名第三【演算法】：排名第四前言在前面我們講述了DNN的模型與前向反向傳播演算法。而在DNN大類中，卷積神經網路(Convolutional Neural Networks，以下簡稱CNN)是最

【深度學習】卷積神經網路（CNN）

卷積神經網路（Convolutional Neural NetWork，CNN）：自然語言處理、醫藥發現、災難氣候發現、人工智慧程式。輸入層：整個神經網路的輸入卷積層：卷積神經網路中最重要的部分，卷積層中每一個節點的輸入只是上一層神經網路的一小塊，一般為3

Udacity深度學習之卷積神經網路(CNN)

卷積神經網路卷積網路簡介卷積神經網路引數共享 padding 維度卷積網路簡介卷積神經網路一個時下非常流行

人工智障學習筆記——深度學習(2)卷積神經網路

上一章最後提到了多層神經網路（deep neural network，DNN），也叫多層感知機（Multi-Layer perceptron,MLP）。當下流行的DNN主要分為應對具有空間性分佈資料的CNN（卷積神經網路）和應對具有時間性分佈資料的RNN（遞迴神經網路，又

深度學習FPGA實現基礎知識10(Deep Learning（深度學習）卷積神經網路(Convolutional Neural Network，CNN))

第一點，在學習Deep learning和CNN之前，總以為它們是很了不得的知識，總以為它們能解決很多問題，學習了之後，才知道它們不過與其他機器學習演算法如svm等相似，仍然可以把它當做一個分類器，仍然可以像使用一個黑盒子那樣使用它。第二點，Deep Learning強大的地方就是可以利用網路中間某一