深度學習權重初始化的幾種方法

阿新 • • 發佈：2019-02-09

經常看到深度學習引數初始化都是使用隨機初始化，但是最近看了一篇文章Spectral Normalization中對於GAN判別器沒有使用BN，BN其實弱化了引數初始化的作用，但是我們一旦不使用了BN,使用傳統的隨機初始化容易出現梯度消失的問題，因此決定嘗試一些其他的引數初始化方法。

神經網路的訓練過程中的引數學習是基於梯度下降法進行優化的。梯度下降法需要在開始訓練時給每一個引數賦一個初始值。這個初始值的選取十分關鍵。一般我們希望資料和引數的均值都為 0，輸入和輸出資料的方差一致。在實際應用中，引數服從高斯分佈或者均勻分佈都是比較有效的初始化方式。

網路上關於引數初始化的介紹很多了，推薦一下

聊一聊深度學習的weight initialization, 深度學習中的引數初始化還有很多介紹原理的文章，這裡的細節就不扣了，感興趣的同學可以看看論文，這裡主要介紹在深度學習的框架下如何使用他們。

1. Tensorflow幾種使用引數初始化的方法

tensorflow 官網
tensorflow 輔助

1.1 截斷高斯分佈

這裡寫圖片描述

使用舉例： tf.truncated_normal_initializer(stddev=0.01)

1.2 xavier初始化(適用於啟用函式是sigmoid和tanh)

這裡寫圖片描述

使用舉例：

tf.contrib.layers.xavier 
_initializer(uniform=True, seed=None, dtype=tf.float32)

1.3 MSRA初始化(適用於啟用函式relu)

這裡寫圖片描述

按照官網的介紹，當設定一定的引數時候就是”MSRA初始化”也就是預設設定。

tf.contrib.layers.variance_scaling_initializer(factor=2.0, mode='FAN_IN', uniform=False, seed=None, dtype=tf.float32)  # MSRA初始化

2. Pytorch幾種使用引數初始化的方法

pytorch官網

2.1 Xavier初始化

2.1.2 uniform形式

這裡寫圖片描述

2.1.2 normal形式

這裡寫圖片描述

2. 2 MSRA

2.2.1 uniform形式

這裡寫圖片描述

2.2.2 normal形式

這裡寫圖片描述

xavier和MSRA在沒有BN的情況之下確實比隨機初始化要好很多！

深度學習權重初始化的幾種方法

經常看到深度學習引數初始化都是使用隨機初始化，但是最近看了一篇文章Spectral Normalization中對於GAN判別器沒有使用BN，BN其實弱化了引數初始化的作用，但是我們一旦不使用了BN,使用傳統的隨機初始化容易出現梯度消失的問題，因此決定嘗試

【深度學習】深度學習權重初始化

本文對CS231中的Training Neural Networks的權重更新部分進行記錄權重的初始化在深度神經網路中起著比較大的重要，算是一個trick，但在實際應用上確是個大殺器。 1. 如果一開始把網路中的權重初始化為0，會發生什麼？因為權重初始

深度學習權重初始化

深度學習其本質是優化所有權重的值，使其達到一個最優解的狀態，這其中，需要更新權重的層包括卷積層、BN層和FC層等。在最優化中，權重的初始化是得到最優解的重要步驟。如果權重初始化不恰當，則可能會導致模型陷入區域性最優解，導致模型預測效果不理想，甚至使損失函式震盪，模型不收斂。而且，使用不同的權重初始化方式，模型

深度學習——Xavier初始化方法

為了使得網路中資訊更好的流動，每一層輸出的方差應該儘量相等。基於這個目標，現在我們就去推導一下：每一層的權重應該滿足哪種條件。文章先假設的是線性啟用函式，而且滿足0點處導數為1，即現在我們先來分析一層卷積：其中ni表示輸入個

js 二維陣列定義和初始化三種方法

來源：http://hi.baidu.com/tang_guangyao/item/238af7f1f33b0631d6ff8ce7 方法一：直接定義並且初始化，這種遇到數量少的情況可以用 var _TheArray = [["0-1","0-2"],["1-1"

深度學習訓練技巧---權重初始化

常量反向傳播 ive str 防止自己對稱性就是導致全零初始化　　全零初始化即所有的變量均被初始化為0，這應該是最笨、最省事的隨機化方法了。然而這種偷懶的初始化方法非常不適合深度學習，因為這種初始化方法沒有打破神經元之間的對稱性，將導致收斂速度很慢甚至訓練失敗

深度學習基礎系列（六）| 權重初始化的選擇

初始化附近 ace back width variable 目的 backend 概率分布　　深層網絡需要一個優良的權重初始化方案，目的是降低發生梯度爆炸和梯度消失的風險。先解釋下梯度爆炸和梯度消失的原因，假設我們有如下前向傳播路徑：　　a1 = w1x + b1　　

【深度學習】權重初始化

為什麼要初始化？暴力初始化效果如何？神經網路，或者深度學習演算法的引數初始化是一個很重要的方面，傳統的初始化方法從高斯分佈中隨機初始化引數。甚至直接全初始化為1或者0。這樣的方法暴力直接，但是往往效果一般。本篇文章的敘述來源於一個國外的討論帖子[1]，下面就自己的理解闡述一下。首先我們來思考

[PyTorch]PyTorch中模型的參數初始化的幾種方法（轉）

plane alt align frame nor view tps class normal ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~本文目錄1. xavier初始化2. kaiming初始化3. 實際使用中看到的初始化3.1 ResN

SpringIOC容器初始化之後，和銷燬之前幾種方法的執行順序

1.搭建一個簡單的Spring環境 2.定義一個介面及其實現類 package com.roger.service; public interface SpringLifeCycleService { void springLifeCycle(); } package co

【深度學習】卷積計算與訓練模型的幾種方法

卷積計算全連線層和卷積層的根本區別在於：全連線層（Dense層）從輸入空間中學到的是全域性模式，而卷積層學到的是區域性模式。因為這個特性，所以卷積神經網路有兩個有趣的性質：平移不變性：卷積神經網路在影象右下角學到的某個模式，它可以在任何地方識別出來這個模式；而對

c++類物件陣列初始化的幾種方法

類物件陣列初始化如有一個如下類： class EquipmentPiece { private: int IDNumber; public: EquipmentPiece(int IDNumber) : IDNumber(IDNumber) {

Vue2.0--14.小白入門教程--例項化多個vue物件,可初始化操作幾種方法

<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>VueJS Tutorials</title> <link href="styles.c

深度學習Deep Learning（04）：權重初始化問題2_ReLu激勵函式

三、權重初始化問題2_ReLu激勵函式 1、說明 2、ReLu/PReLu激勵函式目前ReLu啟用函式使用比較多，而上面一篇論文沒有討論，如果還是使用同樣初始化權重的方法（

jQuery頁面載入初始化的幾種方法

在新的公司裡工作，最近一直在做關於js和jQuery的開發，下面三種是最常見的jquery頁面載入初始化的方法第一種，去年實習時的公司用的是這樣 $(function(){ //定義區

機器學習中常見的幾種歸一化方法以及原因

在機器學習中，資料歸一化是非常重要，它可能會導致模型壞掉或者訓練出一個很奇怪的模型，為了讓機器學習的模型更加適合實際情況，需要對資料進行歸一化處理。 1.機器學習中常用的歸一化方法： 2. 不同歸一化方法分析： 2.1 線性變換和極差法（線性歸一化）將原始資料線性化的方

【Spring學習筆記】4：三種做屬性連線的Annotation,指示初始化和銷燬方法的Annotation

屬性連線屬性連線是指配置DI的方式，之前學了可以在<bean ...></bean>裡面使用<constructor-arg .../>和<property .../> 元素做屬性連線。 Spring裡還可以

[深度學習]網路結構，權重初始化，啟用函式，fine-tune

導語：直接檢視一個神經網路的結構；如何初始化權重，改進準確度；在Keras上建立現行模型；啟用函式的作用；如何fine-tune一個預訓練的Vgg16網路，來分類貓和狗七行程式碼體驗深度學習的發現 Epochs 一個eposh就是

[DeeplearningAI筆記]改善深層神經網路_深度學習的實用層面1.10_1.12/梯度消失/梯度爆炸/權重初始化

覺得有用的話,歡迎一起討論相互學習~Follow Me 1.10 梯度消失和梯度爆炸當訓練神經網路,尤其是深度神經網路時,經常會出現的問題是梯度消失或者梯度爆炸,也就是說當你訓練深度網路時,導數或坡度有時會變得非常大,或非常小,甚至以指數方式變小.這加

在PL/SQL Developer中初始化的幾種方法

在PL/SQL Developer中經常需要用到多組織的view我們用以下幾種方法初始化自己的環境： 1. BEGIN FND_GLOBAL.APPS_INITIALIZE(USER_ID => 1112, RESP_ID => 21872, RESP_

深度學習權重初始化的幾種方法

1. Tensorflow幾種使用引數初始化的方法

1.1 截斷高斯分佈

1.2 xavier初始化(適用於啟用函式是sigmoid和tanh)

1.3 MSRA初始化(適用於啟用函式relu)

2. Pytorch幾種使用引數初始化的方法

2.1 Xavier初始化

2.1.2 uniform形式

2.1.2 normal形式

2. 2 MSRA

2.2.1 uniform形式

2.2.2 normal形式

相關推薦