1. 程式人生 > >卷積神經網路的結構

卷積神經網路的結構

一個卷積神經網路主要由以下5種結構組成:


1.輸入層。輸入層是整個神經網路的輸入,在處理影象的卷積神經網路中,它一般代表了一張圖片的畫素矩陣。比如在圖6-7中,最左側的三維矩陣的長和寬代表了影象的大小,而三維矩陣的深度代表了影象的色彩通道(channel)。比如黑白圖片的深度為1,而在RGB色彩模式下,影象的深度為3。從輸入層開始,卷積神經網路通過不同的神經網路結構下將上一層的三維矩陣轉化為下一層的三維矩陣轉化為下一層的三維矩陣,直到最後的全連線層。

2.卷積層。從名字就可以看出,卷積層是一個卷積神經網路中最重要的部分。和傳統全連線層不同,卷積層中的每一個節點的輸入只是上一層神經網路中的一小塊,這個小塊的大小有3*3或者5*5。卷積層試圖將神經網路中的每一個小塊進行更加深入的分析從而得到抽象程度更高的特徵。一般來說,通過卷積層處理的節點矩陣會變得更深,所以圖6-7中可以看到經過卷積層之後的節點矩陣的深度會增加。

3.池化層。池化層神經網路不會改變三維矩陣的深度,但是它可以縮小矩陣的大小。池化操作可以認為是將一張解析度較高的圖片轉化為解析度較低的圖片。通過池化層,可以進一步縮小最後全連線層中節點的個數,從而達到減少整個神經網路中的引數的目的。

4.全連線層。如圖6-7所示,在經過多輪卷積層和池化層處理之後,在卷積神經網路的最後一般會由1到2個全連線 層來給出最後的分類結果。經過幾輪的卷積層和池化層的處理之後,可以認為影象中的資訊已被抽象成了資訊含量更高的特徵。我們可以將卷積層和池化層看成自動影象特徵提取的過程。在特徵提取完成之後,仍然需要使用全連線層來完成分類任務。

5.Softmax層。Softmax層主要用於分類問題。經過Softmax層,可以得到當前樣例中屬於不同種類的概率分佈情況。