1. 程式人生 > >通道、卷積核、神經元、權值共享的理解

通道、卷積核、神經元、權值共享的理解

1.通道和卷積核的理解

我們有RGB三通道的輸入影象,那麼我們如果獲得一個特徵,那麼我們需要一個卷積核,而這一個卷積核包含三個矩陣。三通道的RGB影象通過這樣的卷積就會變成一個通道的。
比如我輸入的是RGB三個通道的影象7*7*3,那麼我們如果想得到一個影象的一個特徵,那麼我們需要1個3*3的卷積核,這個卷積核包含三個矩陣,將每個矩陣和對應通道進行相乘相加,三個通道對應元素再相加,從而得到一個特徵矩陣。

2.神經元和卷積核的理解

當我們的輸入是一個7*7的影象,那麼我們如果想獲得兩個特徵,我們使用3*3的兩個卷積核即可,這樣經過一次卷積以後,得到兩個5*5的特徵圖,那麼我們卷積層的神經元的個數就是50個(5*5*2).原因在於畫素的個數就是神經元的個數。

3.權值共享的理解

權值共享就是我的每個卷積核(獲得的每一個特徵)裡面的神經元對應的引數都是相同的,而且閾值也是共享的。

比如就正如2所當我們的輸入是一個7*7的影象,那麼我們如果想獲得兩個特徵,我們使用3*3的兩個卷積核即可,這樣經過一次卷積以後,得到兩個5*5的特徵圖。由於每個特徵圖中的神經元共享權值,每個特徵圖上的神經元對應輸入影象3*3的區域,那麼每個神經元的權值個數是3*3=9個,即每個特徵圖上的權值個數也是9個,兩個特徵圖那麼就是2*9=18個。一個神經元對應一個閾值,那麼一個特徵圖也就是一個閾值,兩個特徵圖也就是兩個閾值。