1. 程式人生 > >深度學習基礎--BP和訓練--中繼監督優化(intermediate supervision)

深度學習基礎--BP和訓練--中繼監督優化(intermediate supervision)

中繼監督優化(intermediate supervision)

  如果直接對整個網路進行梯度下降,輸出層的誤差經過多層反向傳播會大幅減小,即發生vanishing gradients現象。為解決此問題,在每個階段的輸出上都計算損失。這種方法可以保證底層引數正常更新。   類似於GoogleNet的auxiliary classfier,用來解決網路隨著深度加深而梯度消失的問題。