深度學習網絡結構中超參數momentum了解

阿新 • • 發佈：2018-05-14

操作如何 moment 新的定性 nbsp 結果初始化結構

訓練網絡時，通常先對網絡的初始權值按照某種分布進行初始化，如：高斯分布。初始化權值操作對最終網絡的性能影響比較大，合適的網絡初始權值能夠使得損失函數在訓練過程中的收斂速度更快，從而獲得更好的優化結果。但是按照某類分布隨機初始化網絡權值時，存在一些不確定因素，並不能保證每一次初始化操作都能使得網絡的初始權值處在一個合適的狀態。不恰當的初始權值可能使得網絡的損失函數在訓練過程中陷入局部最小值，達不到全局最優的狀態。因此，如何消除這種不確定性，是訓練深度網絡是必須解決的一個問題。 momentum 動量能夠在一定程度上解決這個問題。momentum 動量是依據物理學的勢能與動能之間能量轉換原理提出來的。當 momentum 動量越大時，其轉換為勢能的能量也就越大，就越有可能擺脫局部凹域的束縛，進入全局凹域。momentum 動量主要用在權重更新的時候。一般，神經網絡在更新權值時，采用如下公式:
　　　　　　　　　　　　　　　　　　　　　　　　　w = w - learning_rate * dw
引入momentum後，采用如下公式：
　　　　　　　　　　　　　　　v = mu * v - learning_rate * dw w = w + v

其中，v初始化為0，mu是設定的一個超變量，最常見的設定值是0.9。可以這樣理解上式：如果上次的momentum(v)與這次的負梯度方向是相同的，那這次下降的幅度就會加大，從而加速收斂。

操作如何 moment 新的定性 nbsp 結果初始化結構訓練網絡時，通常先對網絡的初始權值按照某種分布進行初始化，如：高斯分布。初始化權值操作對最終網絡的性能影響比較大，合適的網絡初始權值能夠使得損失函數在訓練過程中的收斂速度更快，從而獲得更好的優

深度學習網絡結構中超參數momentum了解

深度學習網絡結構中超參數momentum了解

Overview：end-to-end深度學習網絡在超分辨領域的應用（待續）

mxnet-深度學習網絡

【網絡管理者必知】2分鐘了解新出臺的《網絡安全法》

關於深度學習優化器 optimizer 的選擇，你需要了解這些

學習TensorFlow，TensorBoard可視化網絡結構和參數

如何選取一個神經網絡中的超參數hyper-parameters

5月深度學習班第4課CNN，典型網絡結構與常用框架

11月深度學習班第3課典型CNN網絡結構

吳恩達-深度學習-課程筆記-8: 超參數調試、Batch正則化和softmax( Week 3 )

iperf網絡測試工具中 -l 參數的作用

Dual Path Networks（DPN）——一種結合了ResNet和DenseNet優勢的新型卷積網絡結構。深度殘差網絡通過殘差旁支通路再利用特征，但殘差通道不善於探索新特征。密集連接網絡通過密集連接通路探索新特征，但有高冗余度。

吳恩達深度學習筆記 course2 week3 超參數調試,Batch Norm,和程序框架

機器學習：SVM（scikit-learn 中的 RBF、RBF 中的超參數 γ）

Open stack生產環境中幾種常見的網絡結構

Deep Belief Network簡介——本質上是在做逐層無監督學習，每次學習一層網絡結構再逐步加深網絡

論文學習-系統評估卷積神經網絡各項超參數設計的影響-Systematic evaluation of CNN advances on the ImageNet

網絡結構的初始化

初識Socket通信：基於TCP和UDP協議學習網絡編程

Weave 網絡結構分析 - 每天5分鐘玩轉 Docker 容器技術（64）

深度學習網絡結構中超參數momentum了解

相關推薦