1. 程式人生 > >GoogleNet學習與實現

GoogleNet學習與實現

專案地址:https://github.com/zhongqianli/caffe_googlenet

22層的深度網路,引入了Inception模組,使用了多個loss。使用1x1的bottleneck,用於增加網路的深度和寬度,可以減少計算量。最後使用了avg pool。

解決的問題

提出了一種高效的深度學習框架,代號為Inception,它受到NiN網路的啟發。

1x1conv

簡單說,是特徵降維,是feature pooling,filter space的transform。這種跨特徵層的級聯結構,可以有助於不同特徵層間的空間資訊互動。

細節

為了避免patch-alignment問題, 卷積核的尺寸限定為1×1, 3×3 和 5×5。
網路的設計遵循了這樣的規則:視覺資訊應該在不同尺寸進行處理,然後將它們合併在一起供下一階段使用。

多個loss的作用

改善深度網路的收斂性。(《Rethinking the Inception Architecture for Computer Vision》的作者認為是充當正則化器)