機器學習 影象識別(3)
繼續分享如何設計圖形識別的神經網路結構。在卷積神經網路CNN中,決定某一層輸出結果中一個元素所對應的輸入層的區域大小,被稱作感受野receptive field。感受野用來表示網路內部的不同神經元對原影象的感受範圍的大小,或者說,convNets(cnn)每一層輸出的特徵圖(feature map)上的畫素點在原始影象上對映的區域大小。

第二層神經網路層

設計神經網路結構

圖


圖
之前瞭解了 sigmoid 啟用函式,今天給大家講一講 ReRul 啟用函式,我儘量用自己語言來描述,不對地方不是讓大家海涵,而是讓大家指正,我也在學習的路上。 ReRul 以 0為分界線一側也就是小於 0 都為 0 。而大於 0 都是其數值本身。所以他比較穩定,相對於 sigmoid 啟用函式。

圖

神經網路結構圖
前幾層我們可以用 sigmoid 來進行運算在輸出層可以考慮用 ReLU 函式來計算啟用值

整體結構圖

神經網路結構圖
這裡通過對圖進行學習,通過設計神經網路結構來分析該圖屬於哪個分類。白色線表示加權為 1 而黑色線表示加權為 -1 這裡暫時不考慮偏移量。

圖
先看第一層是四個位置畫素值,第二層神經元是有兩個畫素決定的,分辨是兩側為白色畫素的情況以及下面黑白畫素組合的情況。

第一層神經網路
看神經網路的第一層,上面兩個為黑色畫素,下面兩個為白色畫素圖為輸入,我們神經元安位置接受畫素的啟用值。第一層從上到下分別為 -1 -1 1 1 , 白色為 1 而黑色用 -1 表示。

第二層神經網路
第二層神經網路每個神經元為兩個畫素組成,第一層神經元值作為輸入,通過加權計算出第二層神經元的啟用值。上數第一個輸入值為 -1 和 1 第一層神經網路的第1和第4 的神經元,進行計算 - 1 * 1 + 1 * 1(白色線為 1 ) = 0 即取和為 0 。第二個神經元同理,我們就說說第三個吧,- 1 * 1 + 1 * -1 = -2 ,然後用 sigmoid 壓縮為 -1。看一看他就是原圖的反向排列。

第三層神經網路
第三層是由四個畫素組成的,兩個第二層的神經元的組合,前兩個兩 0 和為零,第三個是 -1* 1 + -1 *- 1 = 0,第四個是 -1 *1 + -1 *1 = -2 壓縮後為 -1 。

圖
最後進入輸入,使用 ReLU 啟用函式,那麼我們就只看最後一個,-1 * 1 為 -1 根據 ReLU 只要小於零的數均按 0 處理所以為 0,而 -1 * -1 為 1 所以我們得出結果是最後一個。