1. 程式人生 > >深度學習之影象分類模型AlexNet解讀

深度學習之影象分類模型AlexNet解讀

版權宣告:本文為博主原創文章 https://blog.csdn.net/sunbaigui/article/details/39938097

在imagenet上的影象分類challenge上Alex提出的alexnet網路結構模型贏得了2012屆的冠軍。要研究CNN型別DL網路模型在影象分類上的應用,就逃不開研究alexnet,這是CNN在影象分類上的經典模型(DL火起來之後)。

在DL開源實現caffe的model樣例中,它也給出了alexnet的復現,具體網路配置檔案如下https://github.com/BVLC/caffe/blob/master/models/bvlc_reference_caffenet/train_val.prototxt

接下來本文將一步步對該網路配置結構中各個層進行詳細的解讀(訓練階段):

1. conv1階段DFD(data flow diagram):


2. conv2階段DFD(data flow diagram):


3. conv3階段DFD(data flow diagram):


4. conv4階段DFD(data flow diagram):


5. conv5階段DFD(data flow diagram):


6. fc6階段DFD(data flow diagram):


7. fc7階段DFD(data flow diagram):


8. fc8階段DFD(data flow diagram):



各種layer的operation更多解釋可以參考http://caffe.berkeleyvision.org/tutorial/layers.html

從計算該模型的資料流過程中,該模型引數大概5kw+。