TensorFlow學習筆記之--[tf.clip_by_global_norm,tf.clip_by_value,tf.clip_by_norm等的區別]

阿新 • • 發佈：2018-12-02

以下這些函式可以用於解決梯度消失或梯度爆炸問題上。

1. tf.clip_by_value

tf.clip_by_value(
    t,
    clip_value_min,
    clip_value_max,
    name=None
)

輸入一個張量t，把t中的每一個元素的值都壓縮在clip_value_min和clip_value_max之間。小於min的讓它等於min，大於max的元素的值等於max。

例子：

import tensorflow as tf;
import numpy as np;
 
A = np.array([[1,1,2,4], [3,4,8,5]])
 
with tf.Session() as sess:
    print sess.run(tf.clip_by_value(A, 2, 5))

>>>
[[2 2 2 4]
 [3 4 5 5]]

2. tf.clip_by_norm

tf.clip_by_norm(
    t,
    clip_norm,
    axes=None,
    name=None
)

指對梯度進行裁剪，通過控制梯度的最大正規化，防止梯度爆炸的問題，是一種比較常用的梯度規約的方式。

t: 輸入tensor，也可以是list
clip_norm: 一個具體的數，如果\(l_2 \, norm(t)≤clip\_norm\)，則t不變化；否則\(t=\frac{t*clip\_norm}{l_2norm(t)}\)

注意上面的t可以是list,所以最後做比較的時候是將t的二正規化和clip_norm作比較。看下面的例子：

a = np.array([2.,5.])
b = tf.clip_by_norm(a, 5)
with tf.Session() as sess:
    print(sess.run(tf.norm(a)))
    print(sess.run(b))
    
>>>
5.3851647
[1.8569534 4.6423836]

3. tf.clip_by_average_norm

tf.clip_by_average_norm(
    t,
    clip_norm,
    name=None
)

其實和tf.clip_by_norm類似，只不過把\(l_2\,norm(t)\)

改成了\(l_2\,norm_avg(t)=\frac{1}{n} \, l_2\,norm(t)\),\(n\)表示t的元素個數。

例子

a = np.array([3, 4]).astype('float32')
e = tf.clip_by_average_norm(a, 1)
with tf.Session() as sess:
    print(sess.run(e))

>>>
[1.2 1.6]

驗證一下:\(\frac{3*1}{\frac{1}{2}\sqrt{3^2+4^2}}=\frac{3}{2.5}=1.2\)。

4. tf.clip_by_global_norm

tf.clip_by_global_norm(
    t_list,
    clip_norm,
    use_norm=None,
    name=None
)

注意這裡的t_list是a tuple or list of tensors。

global_norm計算公式如下:

\[global\_norm=\sqrt{\sum_i^n{l_2 norm(t[i])^2}}\]

如果global_norm>clip_norm,則t_list中所有元素若如下計算:

\[t\_list[i]=\frac{t\_list[i]*clip\_norm}{max(global\_norm,clip\_norm)}\]

TensorFlow學習筆記之--[tf.clip_by_global_norm,tf.clip_by_value,tf.clip_by_norm等的區別]

以下這些函式可以用於解決梯度消失或梯度爆炸問題上。 1. tf.clip_by_value tf.clip_by_value( t, clip_value_min, clip_value_max, name=None ) 輸入一個張量t，把t中的每一個元素的值都

Tensorflow學習筆記之tf.nn.relu

Tensorflow學習筆記之tf.nn.relu 關於Tensorflow的學習筆記大部分為其他部落格或者書籍轉載，只為督促自己學習。線性整流函式（Rectified Linear Unit，ReLU），又稱修正線性單元。其定義如下圖，在橫座標的右側，ReLU函式為線性函式。在橫座標

Tensorflow學習筆記之tf.layers.conv2d

Tensorflow學習筆記關於Tensorflow的學習筆記大部分為其他部落格或者書籍轉載，只為督促自己學習。 conv2d(inputs, filters, kernel_size, strides=(1, 1), padding='valid', d

Tensorflow學習筆記（用哪學哪)tf.nn.dropout

tf.nn.dropout(x, keep_prob, noise_shape=None, seed=None, name=None) 根據給出的keep_prob引數，將輸入tensor x按比例輸出。預設情況下, 每個元素儲存或丟棄都是獨立的 x

TensorFlow學習筆記[一]—— 填充張量函式 tf.pad 解析

函式的作用：對張量按照你的需求進行填充函式原型：pad( tensor, paddings, mode='CONSTANT', name=None )引數說明：tensor: A 'Tensor'. #tensor是要填充的張量;

Tensorflow學習筆記之池化

Tensorflow學習筆記之池化在深度學習網路中，經常會遇到池化操作，並且往往是在卷積之後，池化操作的意義是降低卷積層輸出特徵向量的維度，並且通過不同的池化方法使不同維度的卷積層輸出結果得到相同維度的特徵向量結果。 1、一般池化池化過程作用於不重疊區域我們定義池化視窗的大小為s

tensorflow學習筆記之使用tensorflow進行MNIST分類（3）

在載入MNIST資料集時候用到了Input_data.py。這段程式碼其實非常重要，現在和大家一起分享一下我的學習理解 #coding=utf-8 #input_data.py的詳解 #學習讀取資料檔案的方法，以便讀取自己需要的資料庫檔案（二進位制檔案） """Funct

TensorFlow學習筆記之疑問解答（持續更新）

1、tensorflow中一箇中括號和兩個中括號是什麼意思？ b = tf.constant([3,3]) c = tf.constant([[3,3]]) with tf.Session() as sess: print(b,c) pri

TensorFlow學習筆記之原始碼分析（3）---- retrain.py

"""簡單呼叫Inception V3架構模型的學習在tensorboard顯示了摘要。這個例子展示瞭如何採取一個Inception V3架構模型訓練ImageNet影象和訓練新的頂層，可以識別其他類的影象。每個影象裡，頂層接收作為輸入的一個2048維向量。這

tensorflow學習筆記之使用tensorflow進行MNIST分類（2）

接著上一篇：http://blog.csdn.net/IEEE_FELLOW/article/details/53012351 本文參考Yann LeCun的LeNet5經典架構，稍加ps得到下面適用於本手寫識別的cnn結構，構造一個兩層卷積神經網路，神經網路的結構如下圖

TensorFlow學習筆記之五——原始碼分析之最近演算法

import numpy as np import tensorflow as tf # Import MINST data import input_data mnist = input_data.read_data_sets("/tmp/data/", one_hot=

TensorFlow學習筆記之三——適合入門的一些資源

Github上除了有TensorFlow的原始碼庫之外，還有一些很不錯的適合入門的資源。現在將目前已經接觸到的資源整理出來，和大家分享。1、TensorFlow原始碼庫https://github.com/tensorflow/tensorflow2、TensorFlow中文

TensorFlow學習筆記之——常用函式（概覽）

本文章內容比較繁雜，主要是一些比較常用的函式的用法，結合了網上的資料和原始碼，還有我自己寫的示例程式碼。建議照著目錄來看。1.矩陣操作1.1矩陣生成這部分主要將如何生成矩陣，包括全０矩陣，全１矩陣，隨機數矩陣，常數矩陣等tf.ones | tf.zeros tf.ones(

TensorFlow學習筆記之原始碼分析（1）----最近演算法nearest_neighbor

import numpy as np import tensorflow as tf # Import MINST data import input_data mnist = input_data.read_data_sets("/tmp/data/", one_hot

Tensorflow 學習筆記之使用LSTM實現MNIST資料集

LSTM實現MNIST手寫集識別這幾天剛好看了RNN之後瞭解了LSTM（原理可以去參考這個）。雖然LSTM主要用於處理自然語言、語音、機器人翻譯等領域，但圖片也可以看做一個有序列的資料。所以用LSTM

Android學習筆記之淺談@id與@+id之間的區別

<Button android:id="@+id/button3" //定義了一個Button取名為button3 android:layout_width="wrap_content" android:layout_height="wrap_content" android:layout_cen

Tensorflow學習筆記——tf.ummary用法

轉於;https://www.cnblogs.com/lyc-seu/p/8647792.html Tensorflow學習筆記——tf.ummary用法最近在研究tensorflow自帶的例程speech_command,順便學習t

tensorflow學習筆記1：tf.Variable、tf.get_variable與tf.get_variable、tf.variable_scope對比總結

** 0. 淺談tensorflow變數機制 ** tensorflow提供了通過變數名稱來建立或者獲取一個變數的機制。通過這個機制，在不同的函式中可以直接通過變數的名字來使用變數，而不需要將變數通過引數的形式到處傳遞，實現了變數共享。 ** 1. 對比tf.V

TensorFlow學習筆記 —— tf.train.Optimizer

反正是要學一些API的，不如直接從例子裡面學習怎麼使用API，這樣同時可以複習一下一些基本的機器學習知識。但是一開始開始和以前一樣，先直接講類和常用函式用法，然後舉例子。這裡主要是各種優化器，以及使用。因為大多數機器學習任務就是最小化損失，在損失定義的情況下，後面的工作就交給優化器啦。

TensorFlow學習筆記 —— tf.nn.nce_loss

Tensorflow 的NCE-Loss的實現和word2vec 這兩天因為實現mxnet的nce-loss，因此研究了一下tensorflow的nce-loss的實現。所以總結一下。先看看tensorflow的nce-loss的API： def nce_loss(weights, b

TensorFlow學習筆記之--[tf.clip_by_global_norm,tf.clip_by_value,tf.clip_by_norm等的區別]

1. tf.clip_by_value

2. tf.clip_by_norm

3. tf.clip_by_average_norm

4. tf.clip_by_global_norm

相關推薦