1. 程式人生 > >VGG學習與實現

VGG學習與實現

專案地址:https://github.com/zhongqianli/caffe_vgg.git

貢獻

論文《VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION》的主要貢獻:網路使用3x3的卷積核,將網路深度提升到16-19。

詳情

a very small receptive field: 3 × 3 (which is the smallest size to capture the notion of left/right, up/down,
center)

Max-pooling is performed over a 2 × 2 pixel window, with stride 2

沒有使用LRN,因為沒有提升精度,卻會增加計算量。

最後使用三個全連線層FC。

兩個3x3卷積連線在一起具有的有效感受野等同於一個5x5卷積的感受野。

三個3x3卷積連線在一起具有的有效感受野等同於一個7x7卷積的感受野。

採用堆疊方法的好處:

  • 增加更多的非線性啟用層,使決策函式更有判別性。
  • 可以減少引數量。