卷積神經網路調參技巧（2）--過擬合（Dropout）

阿新 • • 發佈：2019-02-05

Dropout(丟棄)

首先需要講一下過擬合，訓練一個大型網路時，因為訓練資料有限，很容易出現過擬合。過擬合是指模型的泛化能力差，網路對訓練資料集的擬合能力很好，但是換了其他的資料集，擬合能力就變差了。

在訓練深層網路模型時，按照一定的概率，暫時將神經元丟棄，得到一個更加簡單的網路模型，即每一個batch訓練的網路模型都是不一樣的，都是原始網路的子集，這些子網路共享權值，與原始網路的層數、引數數目相等。這樣，每一個神經元在網路中出現都是獨立的，不會依賴其他神經元。不同的batch訓練得到更多的子網路，提高了網路模型的泛化能力，可以防止過擬合。

由上圖可以看出，（a）是原始神經網路，（b）是dropout之後的網路。

原始網路中第層第個神經元的輸出是：

採用dropout之後的網路中第層第個神經元的輸出是：

其中，是第層第個神經元的輸出，是第層第個神經元的權重（卷積核），

是第層第個神經元的偏置。由伯努利函式以概率隨機的產生0、1向量，來決定網路中第層第個神經元被丟棄還是保留，0表示該神經元被dropout，就是使該神經元的啟用被置零；1則表示該神經元被保留用於構成子網路。

在測試階段：

我們前面說過，其實Dropout是類似於平均網路模型。我們可以這麼理解，我們在訓練階段訓練了1000個網路，每個網路生成的概率為Pi，然後我們在測試階段的時候，我們肯定要把這1000個網路的輸出結果都計算一遍，然後用這1000個輸出，乘以各自網路的概率Pi，求得的期望值就是我們最終訓練得到原始網路的精確度。

M是Dropout中所有的子網路的集合,所以當我們在測試階段的時候，我們就是對M中所有的子網路，以其出現的概率進行加權平均，得到期望值，就是原始網路的精確度。

注：經過交叉驗證，dropout率等於0.5的時候效果最好，原因是0.5的時候dropout隨機生成的網路結構最多。

缺點是模型收斂速度會減慢。

卷積神經網路調參技巧（2）--過擬合（Dropout）

卷積神經網路調參技巧（2）--過擬合（Dropout）

Keras學習（四）——CNN卷積神經網路

深度學習（十九）基於空間金字塔池化的卷積神經網路物體檢測

卷積神經網路（CNN）在語音識別中的應用

使用兩層卷積神經網路來實現手寫數字集（面向物件）

卷積神經網路理解（一）：濾波器的意義

用卷積神經網路和自注意力機制實現QANet（問答網路）

卷積神經網路（CNN）_相關知識

卷積神經網路（CNN）一之概念原理

DeepLearning.ai作業:(4-1)-- 卷積神經網路（Foundations of CNN）

DeepLearning.ai筆記:(4-1)-- 卷積神經網路（Foundations of CNN）

機器學習之卷積神經網路（九）

【6年人工智慧開發】簡述卷積神經網路（CNN）

機器學習與深度學習系列連載：第二部分深度學習（十二）卷積神經網路 3 經典的模型（LeNet-5，AlexNet ，VGGNet，GoogLeNet，ResNet）

機器學習與深度學習系列連載：第二部分深度學習（十一）卷積神經網路 2 Why CNN for Image？

機器學習與深度學習系列連載：第二部分深度學習（十）卷積神經網路 1 Convolutional Neural Networks

深度學習方法（五）：卷積神經網路CNN經典模型整理Lenet，Alexnet，Googlenet，VGG，Deep Residual Learning

DeepLearning tutorial（4）CNN卷積神經網路原理簡介+程式碼詳解

Tensorflow學習筆記（第三天）—卷積神經網路

tensorflow學習筆記（第一天）-深度卷積神經網路

卷積神經網路調參技巧（2）--過擬合（Dropout）

相關推薦