1. 程式人生 > >Batch Normalization層

Batch Normalization層

ali 用處 可能性 機構 一個 使用 論文 現在 兩個

  Batch Normalization的加速作用體現在兩個方面:一是歸一化了每層和每維度的scale,所以可以整體使用一個較高的學習率,而不必像以前那樣遷就小scale的維度;二是歸一化後使得更多的權重分界面落在了數據中,降低了overfit的可能性,因此一些防止overfit但會降低速度的方法,例如dropout和權重衰減就可以不使用或者降低其權重。截止到目前,還沒有哪個機構宣布重現了論文中的結果,不過歸一化的用處在理論層面就已經有了保證,以後也許歸一化的形式會有所改變,但逐層的歸一化應該會成為一種標準。

Batch Normalization層