萬字長文|如何直觀解釋卷積神經網路的工作原理？

阿新 • • 發佈：2019-01-01

作者：YJango
日本會津大學|人機互動實驗室博士生
量子位已獲授權編輯釋出

該文是對卷積神經網路的介紹，並假設你理解前饋神經網路。

如果不是，強烈建議讀完《如何簡單形象又有趣地講解神經網路是什麼？》這篇文章後後再來讀該篇。

推薦文章連結：

https://www.zhihu.com/question/22553761/answer/126474394

下面進入正題，開始我們的卷積神經網路之旅——

視覺感知
- 畫面識別是什麼
- 識別結果取決於什麼
影象表達
- 畫面識別的輸入
- 畫面不變形
前饋神經網路做畫面識別的不足
卷積神經網路做畫面識別
- 區域性連線
- 空間共享
- 輸出空間表達
- Depth維的處理
- Zero padding
- 形狀、概念抓取
- 多filters
- 非線性
- 輸出尺寸控制
- 矩陣乘法執行卷積
- Max pooling
- 全連線層
- 結構發展
畫面不變性的滿足
- 平移不變性
- 旋轉和視角不變性
- 尺寸不變性
- Inception的理解
- 1x1卷積核理解
- 跳層連線ResNet

視覺感知

一. 畫面識別是什麼任務？

學習知識的第一步就是明確任務，清楚該知識的輸入輸出。卷積神經網路最初是服務於畫面識別的，所以我們先來看看畫面識別的實質是什麼。

先觀看幾組動物與人類視覺的差異對比圖。

1. 蒼蠅的視覺和人的視覺的差異

2. 蛇的視覺和人的視覺的差異

△ 更多對比圖請參考http://chuansong.me/n/2656056

通過上面的兩組對比圖可以知道，即便是相同的圖片經過不同的視覺系統，也會得到不同的感知。

這裡引出一條知識：生物所看到的景象並非世界的原貌，而是長期進化出來的適合自己生存環境的一種感知方式。蛇的獵物一般是夜間行動，所以它就進化出了一種可以在夜間也能很好觀察的感知系統，感熱。

任何視覺系統都是將影象反光與腦中所看到的概念進行關聯。

所以畫面識別實際上並非識別這個東西客觀上是什麼，而是尋找人類的視覺關聯方式，並再次應用。如果我們不是人類，而是蛇類，那麼畫面識別所尋找的f就和現在的不一樣。

畫面識別實際上是尋找（學習）人類的視覺關聯方式

萬字長文|如何直觀解釋卷積神經網路的工作原理？

作者：YJango 日本會津大學|人機互動實驗室博士生量子位已獲授權編輯釋出該文是對卷積神經網路的介紹，並假設你理解前饋神經網路。如果不是，強烈建議讀完《如何簡單形象又有趣地講解神經網路是什麼？》這篇文章後後再來讀該篇。推薦文章連結： https://www.zhihu.com/ques

卷積神經網路工作原理直觀的解釋

先坦白地說，有一段時間我無法真正理解深度學習。我檢視相關研究論文和文章，感覺深度學習異常複雜。我嘗試去理解神經網路及其變體，但依然感到困難。接著有一天，我決定一步一步，從基礎開始。我把技術操作的步驟分解開來，並手動執行這些步驟（和計算），直到我理解它們如何工作。這相當費時，且令人緊張，但是結果非凡

深度學習--卷積神經網路工作原理

萬能的知乎從知乎上看一篇文章，問題是卷積神經網路工作原理直觀的解釋，知乎大神用各種動圖對卷積神經網路的訓練做了介紹。YJango的回答最為精彩。奉上鍊接，希望你也能從這個回答中對卷積神經網路有更為確切的認識。https://www.zhihu.com/question/

淺談卷積神經網路CNN原理

做手寫數字識別時，對網路結構進行到了調整，提高了識別的精度。傳統的機器學習演算法，簡單的神經網路(如多層感知機)都可以識別手寫數字，我們要採用卷積神經網路CNN來進行別呢？CNN到底是怎麼識別的？用CNN有哪些優勢呢？我下面就來簡單分析一下。為什麼要用神經網路？對於同一個分類任務，我

卷積神經網路CNN原理——結合例項matlab實現

卷積神經網路CNN是深度學習的一個重要組成部分，由於其優異的學習效能（尤其是對圖片的識別）。近年來研究異常火爆，出現了很多模型LeNet、Alex net、ZF net等等

【深度學習系列】卷積神經網路CNN原理詳解(一)——基本原理

轉自：https://www.cnblogs.com/charlotte77/p/7759802.html 上篇文章我們給出了用paddlepaddle來做手寫數字識別的示例，並對網路結構進行到了調整，提高了識別的精度。有的同學表示不是很理解原理，為什麼傳統的機

卷積神經網路的直觀解釋（筆記）

原文地址：請戳這裡譯文地址：請戳這裡這篇博文讓我對卷積神經網路有了更好的理解，我把要點整理在這裡，供以後回顧：如果你對神經網路也不是很熟悉的話，請戳這裡卷積神經網路（ ConvNets或者CNNs）是神經網路的範疇。應用領域：影象識別

詳細解釋CNN卷積神經網路各層的引數和連線個數的計算

積神經網路是一個多層的神經網路，每層由多個二維平面組成，而每個平面由多個獨立神經元組成。圖：卷積神經網路的概念示範：輸入影象通過和三個可訓練的濾波器和可加偏置進行卷積，濾波過程如圖一，卷積後在C1層產生三個特徵對映圖，然後特徵對映圖中每組的四個畫素再進行

CNN卷積神經網路原理的直觀理解

哈哈？偶然在知乎上翻到了我旭神對CNN原理的通俗易懂的解釋，看完以後簡直醍醐灌頂呢。下面上頭像！！哼，趕緊記錄一下加強一下理解！轉自知乎我旭神如果學過數字影象處理，對於卷積核的作用應該不陌生，比如你做一個最簡單的方向濾波器，那就是一個二維卷積核，這個

史上對tensorflow卷積神經網路中的padding引數最詳細解釋！

當使用tensorflow建立卷積神經網路時，肯定要用到卷積層和池化層，tendorflow關於建立卷積層和池化層的API都有padding這個引數，如下所示： - tf.nn.conv2d(input,filter,strides,padding) - tf.nn.max_pool(inp

詳細解釋CNN卷積神經網路各層的引數和連結個數的計算

卷積神經網路是一個多層的神經網路，每層由多個二維平面組成，而每個平面由多個獨立神經元組成。圖：卷積神經網路的概念示範：輸入影象通過和三個可訓練的濾波器和可加偏置進行卷積，濾波過程如圖

CNN卷積神經網路應用於人臉識別（詳細流程+程式碼實現)和相應的超引數解釋

DeepLearning tutorial（5）CNN卷積神經網路應用於人臉識別（詳細流程+程式碼實現） @author：wepon 本文主要講解將CNN應用於人臉識別的流程，程式基於Python+numpy+theano+PIL開發，採用類似LeNet5的

卷積神經網路CNN（3）—— FCN(Fully Convolutional Networks)要點解釋

前言參考FCN論文：Fully Convolutional Networks for Semantic Segmentation FCN作為影象語義分割的先河，實現畫素級別的分類（即end to end，pixel-wise），為後續使用CNN作為基礎的影

深度學習與卷積神經網路（直觀理解）

基本上在輸入影象中，如果有一個形狀是類似於這種濾波器的代表曲線，那麼所有的乘積累加在一起會導致較大的值！現在讓我們看看當我們移動我們的過濾器時會發生什麼。可以看到結果值是0哦，為什麼？還不明白麼，因為耳朵的邊緣和剛剛尾股部曲線太不同了。這樣的多個濾波器就可以在大量資料的訓練下得到大量特徵了

卷積神經網路_影象卷積解釋

學習卷積神經網路一段時間了，記錄下關於卷積神經網路中影象卷積的原理。互相學習交流。 1、人工神經網路首先看下人工神經網路感知器的原理圖，這個不是重點，但是卷積神經網路由此而來，所以擷取材料如下：

Keras學習（四）——CNN卷積神經網路

本文主要介紹使用keras實現CNN對手寫資料集進行分類。示例程式碼： import numpy as np from keras.datasets import mnist from keras.utils import np_utils from keras.models impo

深度學習（十九）基於空間金字塔池化的卷積神經網路物體檢測

原文地址：http://blog.csdn.net/hjimce/article/details/50187655 作者：hjimce 一、相關理論本篇博文主要講解大神何凱明2014年的paper：《Spatial Pyramid Pooling in Dee

淺析卷積神經網路的內部結構

提到卷積神經網路（CNN），很多人的印象可能還停留在黑箱子，輸入資料然後輸出結果的狀態。裡面超級多的引數、眼花繚亂的命名可能讓你無法短時間理解CNN的真正內涵。這裡推薦斯坦福大學的CS231n課程，知乎上有筆記的中文翻譯。如果你需要更淺顯、小白的解釋，可以讀讀看本文。文章大部分理解都源自於CS3

TensorFlow官方文件樣例——三層卷積神經網路訓練MNIST資料

上篇部落格根據TensorFlow官方文件樣例實現了一個簡單的單層神經網路模型，在訓練10000次左右可以達到92.7%左右的準確率。但如果將神經網路的深度拓展，那麼很容易就能夠達到更高的準確率。官方中文文件中就提供了這樣的樣例，它的網路結構如

用TensorFlow訓練卷積神經網路——識別驗證碼

需要用到的包：numpy、tensorflow、captcha、matplotlib、PIL、random import numpy as np import tensorflow as tf # 深度學習庫 from captcha.image import ImageCaptcha

萬字長文|如何直觀解釋卷積神經網路的工作原理？

作者：YJango 日本會津大學|人機互動實驗室博士生 量子位 已獲授權編輯釋出

目錄

視覺感知

一. 畫面識別是什麼任務？

△ 更多對比圖請參考http://chuansong.me/n/2656056

相關推薦

作者：YJango
日本會津大學|人機互動實驗室博士生
量子位已獲授權編輯釋出