tensorflow clip_by_norm函式理解

阿新 • • 發佈：2019-02-04

clip_by_norm

這裡的clip_by_norm是指對梯度進行裁剪，通過控制梯度的最大正規化，防止梯度爆炸的問題，是一種比較常用的梯度規約的方式。

tensorflow中的clip_by_norm

示例

optimizer = tf.train.AdamOptimizer(learning_rate, beta1=0.5)
grads = optimizer.compute_gradients(cost)
for i, (g, v) in enumerate(grads):
    if g is not None:
        grads[i] = (tf.clip_by_norm(g, 5 
), v)  # clip gradients
train_op = optimizer.apply_gradients(grads)

上面是一段比較通用的定義梯度計算公式的程式碼，其中用到了tf.clip_by_norm這個方法，下面是該函式的原始碼：

def clip_by_norm(t, clip_norm, axes=None, name=None):
  """Clips tensor values to a maximum L2-norm.

  Given a tensor `t`, and a maximum clip value `clip_norm`, this operation
  normalizes `t` so that its L2-norm is less than or equal to `clip_norm`,
  along the dimensions given in `axes`. Specifically, in the default case
  where all dimensions are used for calculation, if the L2-norm of `t` is
  already less than or equal to `clip_norm`, then `t` is not modified. If
  the L2-norm is greater than `clip_norm`, then this operation returns a
  tensor of the same type and shape as `t` with its values set to:

  `t * clip_norm / l2norm(t)`

  In this case, the L2-norm of the output tensor is `clip_norm`.

  As another example, if `t` is a matrix and `axes == [1]`, then each row
  of the output will have L2-norm equal to `clip_norm`. If `axes == [0]`
  instead, each column of the output will be clipped.

  This operation is typically used to clip gradients before applying them with
  an optimizer.

  Args:
    t: A `Tensor`.
    clip_norm: A 0-D (scalar) `Tensor` > 0. A maximum clipping value.
    axes: A 1-D (vector) `Tensor` of type int32 containing the dimensions
      to use for computing the L2-norm. If `None` (the default), uses all
      dimensions.
    name: A name for the operation (optional).

  Returns:
    A clipped `Tensor`.
  """ 

  with ops.name_scope(name, "clip_by_norm", [t, clip_norm]) as name:
    t = ops.convert_to_tensor(t, name="t")

    # Calculate L2-norm, clip elements by ratio of clip_norm to L2-norm
    l2norm_inv = math_ops.rsqrt(
        math_ops.reduce_sum(t * t, axes, keep_dims=True))
    tclip = array_ops.identity(t * clip_norm * math_ops.minimum(
        l2norm_inv, constant_op.constant(1.0 
, dtype=t.dtype) / clip_norm),
                               name=name)

  return tclip

通過註解可以清晰的明白其作用在於將傳入的梯度張量t的L2範數進行了上限約束，約束值即為clip_norm，如果t的L2範數超過了clip_norm，則變換為t * clip_norm / l2norm(t)，如此一來，變換後的t的L2範數便小於等於clip_norm了。

示例

下面我們通過一段程式碼來直觀地展示該函式的作用。

生成隨機數

import numpy as np
t = np.random.randint(low=0,high=5,size=10)
t

array([1, 1, 3, 4, 2, 2, 1, 4, 2, 3])

計算L2範數

l2norm4t = np.linalg.norm(t)
l2norm4t

8.0622577482985491

隨機數規約

clip_norm = 5
transformed_t = t *clip_norm/l2norm4t
transformed_t

array([ 0.62017367,  0.62017367,  1.86052102,  2.48069469,  1.24034735,
        1.24034735,  0.62017367,  2.48069469,  1.24034735,  1.86052102])

驗證

np.linalg.norm(transformed_t)

5.0

可以看出，該隨機數序列的L2範數已經被規約為clip_norm的值。

tensorflow clip_by_norm函式理解

clip_by_norm 這裡的clip_by_norm是指對梯度進行裁剪，通過控制梯度的最大正規化，防止梯度爆炸的問題，是一種比較常用的梯度規約的方式。 tensorflow中的clip_by_norm 示例 optimizer = tf.tr

[TensorFlow]Tensor維度理解

question 分享流動小括號 ash 4.5 就是 axis rank http://wossoneri.github.io/2017/11/15/[Tensorflow]The-dimension-of-Tensor/ Tensor維度理解 Tensor在Tens

tensorflow 中 reduce_sum 理解

post flow const body 理解 ant pan ims tensor 定義如下： reduce_sum( input_tensor, axis=None, keep_dims=False, name=None,

tensorflow常用函式之tf.nn.softmax

關於softmax的詳細說明，請看Softmax。通過Softmax迴歸，將logistic的預測二分類的概率的問題推廣到了n分類的概率的問題。通過公式可以看出當月分類的個數變為2時，Softmax迴歸又退化為logistic迴歸問題。

keras concatenate()函式和tensorflow concat()函式

最近看影象語義分割的相關論文，裡面需要用到層間的合併，例子大多是用keras給出的，以前沒接觸過層合併的函式，特意去查了下tf和keras分別用什麼函式實現的。keras.backend.concatenate 與 tf.concat等價。keras的concatenate直接用的網上的

Tensorflow 損失函式及學習率的四種改變形式

Reference: https://blog.csdn.net/marsjhao/article/details/72630147 分類問題損失函式-交叉熵（crossentropy) 交叉熵描述的是兩個概率分佈之間的距離，分類中廣泛使用的損失函式

tensorflow常用函式筆記

1. tf.Session() 與 tf.InteractiveSession() 用tf.Seesino()構建會話，要定義好所有的operation之後，才能構建會話用tf.InteractiveSession()構建會話，可以先構建一個會話再定義operation，適用於互動式環

tensorflow batch函式實現

def get_batch(image, label, image_W, image_H, batch_size, capacity): image = tf.cast(image, tf.string) label = tf.cast(label, tf.int32)

pytorch 常見函式理解

gather >>> a = torch.Tensor([[1,2],[3,4]]) >>> a tensor([[ 1., 2.], [ 3., 4.]]) >>> torch.gather(a,1,torch.LongTen

（原）faster rcnn的tensorflow程式碼的理解

轉載請註明出處：參考網址：論文：https://arxiv.org/abs/1506.01497 tf的第三方faster rcnn：https://github.com/endernewton/tf-faster-rcnn IOU：https://www.cnblogs.com/

話談tensorflow常見函式truncated_normal與random_normal 聯絡區別

tf.truncated_normal和random_normal都可以生成符合正態分佈的資料，對於前者，對於生成超過標準差2倍的資料會丟棄，後者就按指定標準差生成資料就好。 for example: >>> c = tf.truncated_normal(shap

js封裝物件與js封裝函式理解

1，js封裝物件 1.1 建立：首先建立一個建構函式，建構函式中用this.XXX的形式給這個建構函式新增屬性和方法。給建構函式的原型物件新增方法（建構函式.prortotype.XXX=XXX） 1.2 使用：new一個物件物件.XXX呼叫這個物件封裝的方法。 1.3 提示：建構函式

Tensorflow基礎函式詳解 : tf.placeholder

placeholder函式定義如下： tf.placeholder(dtype, shape=None, name=None) 引數說明：dtype：資料型別。常用的是tf.float32,tf.float64等數值型別。shape：資料形狀。預設是None，就是一維值。如果是多維的話，

回撥函式理解（轉載）

想要詳細理解回撥函式的內容還需要理解與javascript單執行緒和非同步相關知識。 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <

tensorflow啟用函式--tf.nn.dropout

前言：啟用函式（Activation Function）執行時啟用神經網路中某一部分神經元，將啟用資訊向後傳入下一層的神經網路。神經網路的數學基礎是處處可微的，所以選取啟用函式要保證資料輸入與輸出也是可微的。 ### 激勵函式的作用如果不使用啟用函式，此時啟用函式本質上相

faster rcnn的損失函式理解

1. 使用Smoooh L1 Loss的原因對於邊框的預測是一個迴歸問題。通常可以選擇平方損失函式（L2損失）f(x)=x^2。但這個損失對於比較大的誤差的懲罰很高。我們可以採用稍微緩和一點絕對損失函式（L1損失）f(x)=|x|，它是隨著誤差線性增長，而不是平方增長。但這個函式在0點處

TensorFlow常用函式（四）

1、tf.logging.set_verbosity()：設定顯示哪些級別的日誌資訊 TensorFlow使用五個不同級別的日誌訊息。按照上升的順序，它們是DEBUG，INFO，WARN

tensorflow損失函式

啟用函式實現去線性化。神經網路模型中，加入啟用函式後：加入啟用函式和偏置項後公式為：我們常用的啟用函式有。損失函式：解決倆類問題（1)分類問題（2）迴歸問題（1）分類問題通過交叉熵來評估。交叉熵（Cross Entropy）是Shann

vue所有生命週期函式/鉤子函式理解

下邊是一個template 的程式碼，裡邊包含了所有vue 生命週期函式，我們可以vue-cli 專案中新建一個模板把下邊程式碼全都複製進去，然後F12開啟審查元素，觀察這些生命週期函式打印出來的log 裡的區別！ <template> <div class

4.TensorFlow代價函式

一、二次代價函式、交叉熵代價函式、對數似然代價函式（一）二次代價函式相當於把誤差求平方累加再除以樣本總數，求平均（二）交叉熵代價函式（三）對數似然代價函式啟用函式：見博文早期研究神經網路主要採用sigmoid函式或者tanh函式，輸

tensorflow clip_by_norm函式理解

clip_by_norm

tensorflow中的clip_by_norm

示例

示例

生成隨機數

計算L2範數

隨機數規約

驗證

相關推薦