機器學習影象識別（3）

神經網路影象識別 · 發表 2018-11-26 22:42:54

摘要：繼續分享如何設計圖形識別的神經網路結構。在卷積神經網路CNN中，決定某一層輸出結果中一個元素所對應的輸入層的區域大小，被稱作感受野receptive field。感受野用來表示網路內部的不同神經元對原影象的感受範圍的大小，或者說，convNets(cnn)每一層輸出的特徵圖(feature m...

繼續分享如何設計圖形識別的神經網路結構。在卷積神經網路CNN中，決定某一層輸出結果中一個元素所對應的輸入層的區域大小，被稱作感受野receptive field。感受野用來表示網路內部的不同神經元對原影象的感受範圍的大小，或者說，convNets(cnn)每一層輸出的特徵圖(feature map)上的畫素點在原始影象上對映的區域大小。

第二層神經網路層

設計神經網路結構

圖

之前瞭解了 sigmoid 啟用函式，今天給大家講一講 ReRul 啟用函式，我儘量用自己語言來描述，不對地方不是讓大家海涵，而是讓大家指正，我也在學習的路上。 ReRul 以 0為分界線一側也就是小於 0 都為 0 。而大於 0 都是其數值本身。所以他比較穩定，相對於 sigmoid 啟用函式。

圖

神經網路結構圖

前幾層我們可以用 sigmoid 來進行運算在輸出層可以考慮用 ReLU 函式來計算啟用值

整體結構圖

神經網路結構圖

這裡通過對圖進行學習，通過設計神經網路結構來分析該圖屬於哪個分類。白色線表示加權為 1 而黑色線表示加權為 -1 這裡暫時不考慮偏移量。

圖

先看第一層是四個位置畫素值，第二層神經元是有兩個畫素決定的，分辨是兩側為白色畫素的情況以及下面黑白畫素組合的情況。

第一層神經網路

看神經網路的第一層，上面兩個為黑色畫素，下面兩個為白色畫素圖為輸入，我們神經元安位置接受畫素的啟用值。第一層從上到下分別為 -1 -1 1 1 ，白色為 1 而黑色用 -1 表示。

第二層神經網路

第二層神經網路每個神經元為兩個畫素組成，第一層神經元值作為輸入，通過加權計算出第二層神經元的啟用值。上數第一個輸入值為 -1 和 1 第一層神經網路的第1和第4 的神經元，進行計算 - 1 * 1 + 1 * 1（白色線為 1 ） = 0 即取和為 0 。第二個神經元同理，我們就說說第三個吧，- 1 * 1 + 1 * -1 = -2 ，然後用 sigmoid 壓縮為 -1。看一看他就是原圖的反向排列。

第三層神經網路

第三層是由四個畫素組成的，兩個第二層的神經元的組合，前兩個兩 0 和為零，第三個是 -1* 1 + -1 *- 1 = 0，第四個是 -1 *1 + -1 *1 = -2 壓縮後為 -1 。

圖

最後進入輸入，使用 ReLU 啟用函式，那麼我們就只看最後一個，-1 * 1 為 -1 根據 ReLU 只要小於零的數均按 0 處理所以為 0，而 -1 * -1 為 1 所以我們得出結果是最後一個。

機器學習 影象識別（3）

您可能也會喜歡…

機器學習影象識別（3）