AlexNet 講解及pytorch實現 ----1 AlexNet主要技術突破點

阿新 • • 發佈：2018-11-11

一. AlexNet網路結構

2012年，該網路ILSVRC-2012影象分類的冠軍，top-5的識別錯誤率為15.3%，比第二名高出10個百分點。

下面是論文中的網路結構：

原始網路將模型分為兩部分，分開在兩個GPU上訓練，與下面合併的網路結構等價：
在這裡插入圖片描述

各部分網路結構的引數及輸入輸出影象大小計算：

二. AlexNet的意義及技術優勢

1. 在神經網路羅發展歷史上的重要意義

證明了CNN在複雜模型下的有效性
使用GPU訓練可以在可接受的時間內得到結果
以上兩點推動了深層網路結構的構建以及採用GPU的加速訓練方法。

2. 技術上引進新的思想

啟用函式使用Relu，不再使用sigmoid和tanh函式，其優勢在於收斂速度更快，使得訓練時間更短，已成為卷積神經網路最常用的啟用函式。https://blog.csdn.net/NOT_GUY/article/details/78749509

函式形式： $f (x)$

= m a x ( 0 , x )

f(x) = max(0, x) f(x)=max(0,x)
函式形狀如下：

但是Relu函式最大的缺點是，Dead ReLU Problem（神經元壞死現象）：某些神經元可能永遠不會被啟用，導致相應引數永遠不會被更新（在負數部分，梯度為0）

導致如此的原因有兩個：
- 引數初始化問題: 採用Xavier的變體He initialization,思想是保證輸入和輸出方差相同，故引數服從均值為0，方差為 $\frac{2}{輸入神經元個數}$ 的正態分佈。以及BN層的使用，簡單的說就是線上性變化和非線性啟用函式之間，將數值做一次高斯歸一化和線性變化
- learning rate太高導致在訓練過程中引數更新太大: 設定曉得學習率以及再用adagrad， adam等自動調整學習率的優化演算法
區域性響應歸一化層（Local Response Normalization Layer）
LRN層只存在於第一層卷積層和第二層卷積層的啟用函式後面，引入這一層的主要目的，主要是為了防止過擬合，增加模型的泛化能力.

但是對於這種方法對於演算法的優化程度存在爭議，後期的網路結構基本不再採用這種方法。
採用重疊的最大池化層，來“稍微”減輕過擬合
kernal_size = 33, s=2 ，通過提取33小矩形框中的最大值來提取區域性特徵，減少冗餘資訊。
傳統的卷積層中，相鄰的池化單元是不重疊的。比如stride>=kernel_size，而如果stride<kernel_size，將使用重疊的池化層。

3. 論文減輕過擬合的方法

資料集擴增
大部分演算法過擬合的原因是資料集數量不夠，通過翻轉，裁剪等方法來增加資料集的數量
採用Dropout，來減輕過擬合
實際類似於模型集合的方式，在全連線層中使用Dropout，比如設概率為0.5，則每個隱藏層神經元的輸入以0.5的概率輸出為0。輸出為0的神經元相當於從網路中去除，不參與前向計算和反向傳播。所以對於每次輸入，神經網路都會使用不同的結構。注意在測試時需要將Dropout層去掉。
使用權重衰減的損失函式優化演算法

$\epsilon$ 為學習率， $w_i$ 為第 $i$ 訓練的權重

接來下分析pytorch的AlexNet實現，注意AlexNet沒有使用LRN層。

部落格引用：
1… Xavier 初始化引數的推導
http://andyljones.tumblr.com/post/110998971763/an-explanation-of-xavier-initialization
4. 引數初始化討論https://blog.liexing.me/2017/10/24/deep-learning-weight-initialization/
3.啟用函式討論：https://blog.csdn.net/NOT_GUY/article/details/78749509
5. LRN的探討
https://blog.csdn.net/hduxiejun/article/details/70570086
http://yeephycho.github.io/2016/08/03/Normalizations-in-neural-networks/

AlexNet 講解及pytorch實現 ----1 AlexNet主要技術突破點

一. AlexNet網路結構 2012年，該網路ILSVRC-2012影象分類的冠軍，top-5的識別錯誤率為15.3%，比第二名高出10個百分點。下面是論文中的網路結構：原始網路將模型分為兩部分，分開在兩個GPU上訓練，與下面合併的網路結構等價：

AlexNet 講解及pytorch實現 ----1 AlexNet主要技術突破點

AlexNet原理及Tensorflow實現

AlexNet的出現點燃了深度學習的熱潮,下面對其進行介紹,並使用tensorflow實現. 1. AlexNet網路結構圖片來源:AlexNet的論文整個網路有8個需要訓練的層,前5個為卷積層,最後3層為全連線層. 第一個卷積層輸入的

AlexNet網路的Pytorch實現

1.文章原文地址 ImageNet Classification with Deep Convolutional Neural Networks 2.文章摘要我們訓練了一個大型的深度卷積神經網路用於在ImageNet LSVRC-2010競賽中，將120萬（12百萬）的高解析度影象進行1000個類別的

桶排序講解及python3實現

#!/usr/bin/env python # coding:utf-8 def bucketSort(nums): # 選擇一個最大的數 max_num = max(nums) # 建立一個元素全是0的列表, 當做桶 bucket = [0

yolov3 pytorch實現1

yolo不多做介紹，請參相關部落格和論文本文主要是使用pytorch來對yolo中每一步進行實現參考：https://blog.paperspace.com/tag/series-yolo/ 需要了解：卷積神經網路原理及pytorch實現 yol

TensorFlow之TFRecords檔案的儲存與讀取講解及程式碼實現

先聊一下tfrecord, 這是一種將影象資料和標籤放在一起的二進位制檔案，能更好的利用記憶體，TFRecords是TensorFlow中的設計的一種內建的檔案格式，優點有如下幾種：統一不同輸入檔案的框架它是更好的利用記憶體，更方便複製和移動（TFRecord壓縮的二進位制檔

javaee實戰專案--農貿產品開發（詳細講解及程式碼實現）

這個專案是我第一個與他人合作完成的專案，我用java寫後臺，綜合性較強，用到了hibernate,jsp,servlet，適合那些javaee已經入門，想要通過專案來提高自己的朋友。這個專案原始碼免積分提供大家學習，還有一些模組的程式碼（如數字驗證碼），可以稍作修改就能

語音訊號的梅爾頻率倒譜系數(MFCC)的原理講解及python實現

梅爾倒譜系數（MFCC）　　梅爾倒譜系數（Mel-scale FrequencyCepstral Coefficients，簡稱MFCC）。依據人的聽覺實驗結果來分析語音的頻譜， MFCC分析依據的聽覺機理有兩個第一Mel scale：人耳感知的聲音訊率和聲音的實際頻率並不是線性的，有下面公式 $

【小白學PyTorch】11 MobileNet詳解及PyTorch實現

文章來自微信公眾號【機器學習煉丹術】。我是煉丹兄，歡迎加我微信好友交流學習：cyx645016617。 @[toc] 本來計劃是想在今天講EfficientNet PyTorch的，但是發現EfficientNet是依賴於SENet和MobileNet兩個網路結構，所以本著本系列是給“小白”初學者學習的，所

【小白學PyTorch】12 SENet詳解及PyTorch實現

文章來自微信公眾號【機器學習煉丹術】。我是煉丹兄，有什麼問題都可以來找我交流，近期建立了微信交流群，也在朋友圈抽獎贈書十多本了。我的微信是cyx645016617，歡迎各位朋友。參考目錄： @[toc] 上一節課講解了MobileNet的一個DSC深度可分離卷積的概念，希望大家可以在實際的任務中使用這種方

【小白學PyTorch】13 EfficientNet詳解及PyTorch實現

參考目錄： [TOC] 文章來自微信公眾號【機器學習煉丹術】。我是煉丹兄，如果有疑問或者想要和煉丹兄交流的可以加微信：cyx645016617. efficientNet的論文原文連結: https://arxiv.org/pdf/1905.11946.pdf **模型擴充套件Model scaling

【深度學習】Alexnet網路分析及程式碼實現

簡介 Alexnet是2012年ImageNet比賽的冠軍Hinton及其學生Alex Krizhevsky提出，並以其姓名命名的網路。Alexnet的提出也正式掀起了深度學習的熱潮，激發了研究者對深度學習的熱情。雖然後面出現了更為優秀的VGGNet、GooLeNet、Re

AlexNet(Pytorch實現)

github部落格傳送門部落格園傳送門論文在此: ImageNet Classification with Deep Convolutional Neural Networks 網路結構圖: Pytorch程式碼實現: import torch.nn as n

Windows系統添加虛擬串口及CanToolApp功能1的實現

bash eight 鏈接我們 rtu detail png lap wid 　　我們組一開始嘗試用com0com添加虛擬串口，但是遇到了問題，系統中可以看到添加的虛擬串口，但是用C#無法獲取串口。經過多次嘗試後，我們決定換用Virtual Serial Port Dri

2017-2018-1 20155234 實驗三實時系統及mypwd實現

ket 服務器設計實現 china 成了 image ges cnblogs c語言 2017-2018-1 20155234實驗三實時系統及mypwd實現實驗三-並發程序-1 學習使用Linux命令wc(1) 基於Linux Socket程序設計實現wc（1）服務器(

Android XListView實現原理講解及分析

就是指定不同 true -h -name 修改一個部分 XListview是一個非常受歡迎的下拉刷新控件，但是已經停止維護了。之前寫過一篇XListview的使用介紹，用起來非常簡單，這兩天放假無聊，研究了下XListview的實現原理，學到了很多，今天分享給大家。

Leetcode第1題至第10題思路分析及C++實現

mine long -c 一行而且特殊頭部根據 shard 筆者按照目錄刷題，對於每一道題，力爭使用效率最高（時間復雜度最低）的算法，並全部通過C++代碼實現AC。(文中計算的復雜度都是最壞情況復雜度) 因為考慮到大部分讀者已經在Leetcode瀏覽過題目了，所以

python實現人臉檢測及識別（1）---- 採集人臉資料

本次專案是採用keras深度學習框架，訓練人臉識別模型，採用opencv實時檢測與識別周圍的人臉，本文主要講解如何採集訓練集，本次程式碼在人臉識別的程式碼上添加了將識別的照片依次寫入指定資料夾，並命名(000-499).jpg和顯示識別的第N張照片的文字顯示。程式

pytorch系列 ---5以 linear_regression為例講解神經網路實現基本步驟以及解讀nn.Linear函式

本文主要講述最簡單的線性迴歸函式： y = w

AlexNet 講解及pytorch實現 ----1 AlexNet主要技術突破點

一. AlexNet網路結構

二. AlexNet的意義及技術優勢

1. 在神經網路羅發展歷史上的重要意義

2. 技術上引進新的思想

3. 論文減輕過擬合的方法

相關推薦