1. 程式人生 > >CNN系列學習(一):LeNet-5

CNN系列學習(一):LeNet-5

PDF下載
LeNet-5網路是由LeCun等人在1998年提出,用於解決手寫數字識別,由於提出了卷積與池化這一概念,為後來卷積神經網路的發展奠定了基調。
網路結構如圖:圖片來自原文
可以看到,網路輸入是一個一維的32x32大小的圖片,通過5x5的卷積核,經過6個特徵通道,輸出的到28x28x6的feature maps,通過2x2的下采樣池化後圖片大小降至14x14x6,然後用5X5的卷積核卷積的同時再將6個特徵通道再一次進行組合得到新的16個特徵通道,如圖:
第二個卷積層特徵通道實現細節
之後再通過一個下采樣,變為5x5x16之後,用5x5的卷積核進行全連線的對映,得到一維的120位引數(也可譯為120維引數),然後經過兩次全連線,對映到最後的一維10位引數,在識別出來的那位數字對應位數置為零。
下面再計算一下需要計算的引數值:
對於第一層卷積,卷積核為5x5,步長為一,特徵通道為6,則神經元數量為28x28x6,每一個卷積核計算是會額外新增一個bias引數,則需要計算的引數數量為(5x5+1)x6x28x28,為122304個。
對於第一個池化層,是2x2的取樣,也會有一個偏置,引數數量即為(22+1)6

1414=5880
同理,接下來的卷積層池化層對應的引數數量分別為151600與2000個。到全連線的那個卷積引數為84*(120+1)=10164個。最後一層為84x10=840個。

總結:
LeNet-5網路的最大貢獻不在於實現了手寫數字操作,而是提出了卷積-池化-全連線這種經典的網路連線結構,可以看到後來各種複雜的解決更深更難問題的網路都是這樣的骨架上做的調整修改。