1. 程式人生 > >深度學習-網路Xavier初始化方法

深度學習-網路Xavier初始化方法

參考:
深度學習-網路Xavier初始化方法
通過方差分析詳解最流行的Xavier權重初始化方法

在 Xavier Glorot 和 Yoshua Bengio 2010 年的論文 Understanding the difficulty of training deep feedforward neural networks 中考慮了全連線網路的權重初始化問題,為從均勻分佈中取樣初始化權重提供了理論性分析。該分析的直觀性解釋可以分為兩部分,首先對於前向傳播,我們需要確保所有層的啟用值方差近似相等,因此每一個訓練樣本傳播經過網路的資訊才能保持平滑的屬性。同樣對於反向傳播,每層梯度保持近似的方差將允許資訊平滑地反向流動以更新權重

。近似方差的梯度同樣確保誤差資料能反饋到所有層級,因此它是整個訓練過程中的關鍵。