100天搞定機器學習|Day35 深度學習之神經網路的結構

100天搞定機器學習|Day1資料預處理

100天搞定機器學習|Day2簡單線性迴歸分析

100天搞定機器學習|Day3多元線性迴歸

100天搞定機器學習|Day4-6 邏輯迴歸

100天搞定機器學習|Day7 K-NN

100天搞定機器學習|Day8 邏輯迴歸的數學原理

100天搞定機器學習|Day9-12 支援向量機

100天搞定機器學習|Day11 實現KNN

100天搞定機器學習|Day13-14 SVM的實現

100天搞定機器學習|Day15 樸素貝葉斯

100天搞定機器學習|Day16 通過核心技巧實現SVM

100天搞定機器學習|Day17-18 神奇的邏輯迴歸

100天搞定機器學習|Day19-20 加州理工學院公開課：機器學習與資料探勘

100天搞定機器學習|Day21 Beautiful Soup

100天搞定機器學習|Day22 機器為什麼能學習？

100天搞定機器學習|Day23-25 決策樹及Python實現

100天搞定機器學習|Day26-29 線性代數的本質

100天搞定機器學習|Day 30-32 微積分的本質

100天搞定機器學習|Day33-34 隨機森林

本文為3Blue1Brown之《What is a Neural Network?》學習筆記

觀看地址：bilibili.com/video/av15532370

這集Grant大佬假設大家都沒有神經網路的基礎，為新手講解神經網路基本概念，讓大家再聽說神經網路學習的時候，可以明白究竟是什麼意思。大佬選擇經典的多層感知器（MLP）結構解決手寫數字識別問題，理由是理解了經典原版，才能更好地理解功能強大的變種，比如CNN和LSTM。

首先看看神經元和他們是怎麼連線的

神經元可以理解為一個裝著0到1之間數字的容器。以28*28輸入影象每一個畫素為例，每一個原點都是一個神經元，其中數字代表對於畫素的灰度值，0表示純黑，1表示純白，這個數字在神經網路裡稱作“啟用值”。

這784個神經元就組成了網路的第一層，最後一層的十個神經元代表0-9這十個數，同樣的，他們的啟用值也在0-1之間，代表了輸入影象對應哪個數字的可能性。網路中間層被稱為隱含層，可以看做黑箱，數字識別的具體工作就在這裡完成，這裡加了兩層隱含層，每層有16個神經元——隨便設定的，只是為了顯得好看，後期還可以再調整。

神經網路處理資訊的核心機制正是如此，一層的啟用值通過一定的運算，得出下一層的啟用值。上面也提到784個神經元代表的是數字圖案，那麼下一層啟用值也會產生某些特殊的圖案，最終在輸出層最亮的神經元表示神經網路的選擇。

我們再看看如何訓練，為什麼這種層狀結構就能識別數字呢？

我們可以把數字進行拆解，理想狀況下希望倒數第二層的各個神經元可以分別對應上一個筆畫。

再來看隱含層第一層，當輸入為9或8的上面帶圈的數字時，某個神經元的啟用值就會接近1，希望所有這種位於影象頂部的圓圈圖案都能點亮這個神經元，這樣，從第三次到輸出層，我們只需要學習哪些部件能組合出哪個數字即可。

但是如何識別圓圈呢？同理可以把它拆分成更細微的問題。

於是我們希望網路第二層的各個神經元對應這些短邊，第二層就能把所有關聯短邊的八到十個神經元都點亮，接著就能點亮對於頂部圓圈和長豎條的神經元。

然後我們看看連線的作用

如何讓第二層（隱含層的第一層）中的這一個神經元能夠能夠識別出影象的這一塊區域是否存在一條邊？

我們設計讓第二層的某一個神經元能正確識別影象中的這塊區域裡是否存在一條邊。

我們拿出第一層（輸入層/第0層）的啟用值，並賦上權重（要關注區域的權重為正值，否則為0），這樣對所有畫素值求加權和，就只會累加關注區域的畫素值了。

綠色為正值，紅色為負值，顏色越暗表示權重越接近0

所以想要識別是否存在一條邊，只需要給周圍一圈的畫素都賦予負權重

計算的加權值可以使任意大小的

但是我們需要的是將其壓縮到0-1之間

這裡就需要Sigmoid函數了，這就是啟用函式。

啟用值實際上就是一個對加權之和到底有多正的打分，但是有時加權之和大於0時，也不想點亮神經元，比如想要加權和大於10時才讓他激發，這裡就還需要加上一個偏置值，保證不隨便激發。

權重告訴我們第二個神經元關注什麼樣的畫素圖案

bias告訴我們加權和要多大才能讓神經元的激發有意義

這裡有13000多個引數需要調整，所以這裡所謂的學習就是找到正確的權重和偏置。剛開始講到我們把神經元看作是數字容器，但是這些數字取決於輸入的影象，所以把神經元看過一個函式才更準確，它的輸入是上一層所有神經元的輸出，它的輸出是一個0-1之間的值。其實整個神經網路也是一個函式，輸入784個值，輸出10個值。不過它是一個包含了13000個權重、偏置引數的極其複雜的函式。

需要注意的是，機器學習尤其是神經網路運算與線性代數是密不可分的，之前有過介紹，請移步：

100天搞定機器學習|Day26-29 線性代數的本質

神經網路中需要大量的矩陣乘法和sigmoid對映運算

這種運算方式，非常適合程式設計，比如可以用Python的numpy很簡單的實現。

最後需要一提的是，現在神經網路基本不再使用sigmoid了，比較流行的是ReLU（線性整流函式）。

100天搞定機器學習|Day35 深度學習之神經網路的結構

100天搞定機器學習|Day35 深度學習之神經網路的結構

100天搞定機器學習|Day3多元線性迴歸

100天搞定機器學習|Day4-6 邏輯迴歸

100天搞定機器學習|Day15 樸素貝葉斯

100天搞定機器學習|Day17-18 神奇的邏輯迴歸

100天搞定機器學習|Day23-25 決策樹及Python實現

100天搞定機器學習|Day 30-32 微積分的本質

100天搞定機器學習|Day33-34 隨機森林

100天搞定機器學習|Day36用有趣的方式解釋梯度下降演算法

100天搞定機器學習|day37 無公式理解反向傳播演算法之精髓

100天搞定機器學習|day38 反向傳播演算法推導

100天搞定機器學習|day39 Tensorflow Keras手寫數字識別

100天搞定機器學習|day40-42 Tensorflow Keras識別貓狗

100天搞定機器學習|day43 幾張GIF理解K-均值聚類原理

100天搞定機器學習|Day56 隨機森林工作原理及調參實戰（信用卡欺詐預測）

編程學習第一步，讓你20天搞定Python編程

一篇文章搞懂人工智慧、機器學習和深度學習之間的區別

從0到1 | 0基礎/轉行如何用3個月搞定機器學習

一天搞懂機器學習PPT筆記-1

（資料科學學習手札100）搞定matplotlib中的字型設定

100天搞定機器學習|Day35 深度學習之神經網路的結構

相關推薦