深層神經網路——滑動平均模型

阿新 • • 發佈：2019-02-06

在採用隨機梯度下降演算法訓練神經網路時，使用滑動平均模型在很多應用中都可以在一定程度上提高最終模型在測試資料上的表笑。
在Tensorflow中提供了tf.train.ExponentialMovingAverage來實現滑動平均模型。在初始化ExponentialMovingAverage 時，需要提供一個衰減率（decay）。這個衰減率會用於控制模型的更新速度。ExponentialMovingAverage對每一個變數會維護一個影子變數（shadow variable）,這個影子變數的初始值就是相應變數的初始值，而每次執行變數更新時，影子變數的值會被更新為：
這裡寫圖片描述
其中shadow_variable是影子變數，variable是待更新的變數，decay是衰減率。從公式中可以看到，decay決定了模型更新的速度，decay越大模型越穩定。在實際應用中，decay一般被設定為非常接近1的數（0.99、0.999）,為了使得模型在訓練前期可以更新的更快，ExponentialMovingAverage提供了num_updates引數來動態設定decay的大小。如果ExponentialMovingAverage初始化時提供了num_dates引數，那麼每次使用的衰減率將會是：
這裡寫圖片描述

tf.Varialbe():trainable: 如果為True（預設也為Ture），這個變數就會被新增到圖的集合GraphKeys.TRAINABLE_VARIABLES.中去，這個collection被作為優化器類的預設列表。
程式碼：
這裡寫圖片描述

深層神經網路——滑動平均模型

深層神經網路——滑動平均模型

神經網路優化演算法二（正則化、滑動平均模型）

神經網路中的滑動平均模型

改善深層神經網路_優化演算法_mini-batch梯度下降、指數加權平均、動量梯度下降、RMSprop、Adam優化、學習率衰減

[DeeplearningAI筆記]改善深層神經網路_優化演算法2.3_2.5_帶修正偏差的指數加權平均

Tensorflow中的滑動平均模型

移動平均法，滑動平均模型法（Moving average，MA）

tensorflow的滑動平均模型

改善深層神經網路：超引數除錯、正則化以及優化_課程筆記_第一、二、三週

#####好好好好####Keras深度神經網路訓練分類模型的四種方法

神經網路語音合成模型介紹

CNN卷積神經網路簡單實現模型

深度學習方法（五）：卷積神經網路CNN經典模型整理Lenet，Alexnet，Googlenet，VGG，Deep Residual Learning

第四周深層神經網路

機器學習筆記（十）：TensorFlow實戰二（深層神經網路）

IJCAI 2018 基於主題資訊的神經網路作文生成模型

tensorflow-滑動平均模型

吳恩達改善深層神經網路引數：超引數除錯、正則化以及優化——優化演算法

用大白話講滑動平均模型（Tensorflow）

改善深層神經網路：超引數除錯、正則化以及優化優化演算法第二週

深層神經網路——滑動平均模型

相關推薦