1. 程式人生 > >第二問:小濾波器(卷積核)為什麼有效?

第二問:小濾波器(卷積核)為什麼有效?

一般而言,幾個小濾波器卷積層的組合比一個大濾波器卷積層更好,比如層層堆疊了3個在3×3的卷積層,中間含有非線性啟用層,在這種排列下面,第一個卷積層中每個神經元對輸入資料的感受野是 3×3,第二個卷積層對第一個卷積層的感受野也是3×3,這樣對於輸入資料的感受野就是5×5,同樣,第三個卷積層對第二個卷積層的感受野是3×3,這樣第三個卷積層對於原始輸入資料的感受野就是7×7。

假設這裡不使用3個3×3的感受野,直接單獨使用一個7×7大小的卷積層,那麼所有神經元的感受野也是7×7,但是這樣會有一些缺點。多個卷積層首先與非線性啟用層交替的結構,比單一卷積層的結構更能提取出深層的特徵;其次,假設輸入資料體的深度是C,輸出體的深度也是C,那麼單獨的7×7的卷積層會有7×7×C×C=49× C

2 C^{2} 的引數個數,而使用3個3×3的卷積層的組合,僅僅含有3×(3×3×C×C)=27× C 2 C^{2} 的引數個數。直觀來說,選擇小濾波器的卷積組合能夠對輸入資料表達出更有力的特徵,同時使用的引數也更少。唯一不足的是反向傳播更新引數的時候,中間卷積層可能會佔用更多的記憶體。