tensorflow-啟用函式及tf.nn.dropout

阿新 • • 發佈：2019-01-10

參考《Tensorflow技術解析與實戰》

啟用函式

啟用函式（activation function）將神經元計算wTx+b的結果經過非線性表達對映到下一層。
需要可微，啟用函式不會改變輸入資料維度。
sigmoid函式：σ(x)=11+e−x(1)
- 將輸出對映到（0,1）內，缺點：
  - 軟飽和性：取值無窮大時，一階導數趨於0，容易產生梯度消失。（硬飽和：某階段一階導數等於0）
tanh函式：tanh(x)=1−e−2x1+e−2x(2)
- 也具有軟飽和，收斂速度比sigmoid快
- 會發生梯度消失
relu函式：f(x)=max(x,0)(3)
softplus函式：f(x)=log(

1+ex)(4)
- relu在x<0時硬飽和，x>0梯度不衰減，為1，緩解梯度消失問題
- 收斂快，提供神經網路稀疏表達能力
- 缺點：
  - 部分輸入落入硬飽和區，權重無法更新，發生“神經元死亡”

當輸入資料特徵相差明顯時，tanh效果好，在nlp上用處廣泛。

當特徵不明顯時，sigmoid效果比較好。

使用sigmoid和tanh時，輸入需要進行規範化，否則啟用後的值全部進入平坦區，隱層輸出趨於相同，喪失特徵表達。

relu有時可以不需要，目前大多數選擇relu

dropout函式

以keep_prob的概率值決定是否被抑制，若抑制則神經元為0，若不被抑制，則神經元輸出值y y

∗=1keep_prob

import tensorflow as tf
a = tf.constant([[1.,2.],[5.,-2.]])
relu_a = tf.nn.relu(a)
sigmoid_a = tf.nn.sigmoid(a)
tanh_a = tf.nn.tanh(a)

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    result_relu_a = sess.run(relu_a)
    result_sigmoid_a = sess.run(sigmoid_a)
    result_tanh_a = sess.run(tanh_a)
    print('the result of relu(a) is : \n{}' 
.format(result_relu_a))
    print('the result of sigmoid(a) is : \n{}'.format(result_sigmoid_a))
    print('the result of tanh(a) is : \n{}'.format(result_tanh_a))

the result of relu(a) is : 
[[ 1.  2.]
 [ 5.  0.]]
the result of sigmoid(a) is : 
[[ 0.7310586   0.88079703]
 [ 0.99330717  0.11920292]]
the result of tanh(a) is : 
[[ 0.76159418  0.96402758]
 [ 0.99990916 -0.96402758]]

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    d = tf.constant([[1.,2.,3.,4.],[5.,6.,7.,8.],[9.,10.,11.,12.],[13.,14.,15.,16.]])
    print(sess.run(tf.shape(d)))

    #由於[4,4] == [4,4] 行和列都為獨立
    dropout_a44 = tf.nn.dropout(d, 0.5, noise_shape = [4,4])
    result_dropout_a44 = sess.run(dropout_a44)
    print(result_dropout_a44)

    #noise_shpae[0]=4 == tf.shape(d)[0]=4  
    #noise_shpae[1]=4 != tf.shape(d)[1]=1
    #所以[0]即行獨立，[1]即列相關，每個行同為0或同不為0
    dropout_a41 = tf.nn.dropout(d, 0.5, noise_shape = [4,1])
    result_dropout_a41 = sess.run(dropout_a41)
    print(result_dropout_a41)

    #noise_shpae[0]=1 ！= tf.shape(d)[0]=4  
    #noise_shpae[1]=4 == tf.shape(d)[1]=4
    #所以[1]即列獨立，[0]即行相關，每個列同為0或同不為0
    dropout_a24 = tf.nn.dropout(d, 0.5, noise_shape = [1,4])
    result_dropout_a24 = sess.run(dropout_a24)
    print(result_dropout_a24)
    #不相等的noise_shape只能為1

[4 4]
[[  0.   4.   0.   8.]
 [  0.   0.  14.   0.]
 [  0.   0.  22.   0.]
 [  0.   0.  30.   0.]]
[[  2.   4.   6.   8.]
 [  0.   0.   0.   0.]
 [ 18.  20.  22.  24.]
 [ 26.  28.  30.  32.]]
[[  0.   0.   6.   0.]
 [  0.   0.  14.   0.]
 [  0.   0.  22.   0.]
 [  0.   0.  30.   0.]]

d.shape

TensorShape([Dimension(4), Dimension(4)])

tensorflow-啟用函式及tf.nn.dropout

參考《Tensorflow技術解析與實戰》啟用函式啟用函式（activation function）將神經元計算wTx+b的結果經過非線性表達對映到下一層。需要可微，啟用函式不會改變輸入

tensorflow常用函式之tf.nn.softmax

關於softmax的詳細說明，請看Softmax。通過Softmax迴歸，將logistic的預測二分類的概率的問題推廣到了n分類的概率的問題。通過公式可以看出當月分類的個數變為2時，Softmax迴歸又退化為logistic迴歸問題。

tf.nn.conv2d函式、padding型別SAME和VALID、tf.nn.max_pool函式、tf.nn.dropout函式、tf.nn.softmax函式、tf.reduce_sum函式

tf.nn.conv2d函式：該函式是TensorFlow裡面實現卷積的函式。函式形式： tf.nn.conv2d (input, filter, strides, padding, use_cudnn_on_gpu=None, data_format=None,

tensorflow啟用函式--tf.nn.dropout

前言：啟用函式（Activation Function）執行時啟用神經網路中某一部分神經元，將啟用資訊向後傳入下一層的神經網路。神經網路的數學基礎是處處可微的，所以選取啟用函式要保證資料輸入與輸出也是可微的。 ### 激勵函式的作用如果不使用啟用函式，此時啟用函式本質上相

【Tensorflow】tf.nn.dropout函式

tf.nn.dropout(x, keep_prob, noise_shape=None, seed=None, name=None) 此函式是為了防止在訓練中過擬合的操作，將訓練輸出按一定規則進行變

TensorFlow之tf.nn.dropout()：防止模型訓練過程中的過擬合問題

AC -- 輸出 array 全連接 spa () 激活 odin 一：適用範圍：　　tf.nn.dropout是TensorFlow裏面為了防止或減輕過擬合而使用的函數，它一般用在全連接層二：原理：　　dropout就是在不同的訓練過程中隨機扔掉一部分神經元。也就是

TensorFlow函式之tf.nn.relu()

tf.nn.relu()函式是將大於0的數保持不變，小於0的數置為0，函式如圖1所示。 ReLU函式是常用的神經網路啟用函式之一。圖1 ReLU函式影象下邊為ReLU例子： import tenso

TensorFlow函式之tf.nn.conv2d()（附程式碼詳解）

tf.nn.conv2d是TensorFlow裡面實現卷積的函式，是搭建卷積神經網路比較核心的一個方法。函式格式： tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu = Noen, name = Non

TensorFlow學習---tf.nn.dropout防止過擬合

一、 Dropout原理簡述： tf.nn.dropout是TensorFlow裡面為了防止或減輕過擬合而使用的函式，它一般用在全連線層。 Dropout就是在不同的訓練過程中隨機扔掉一部分神經元。也就是讓某個神經元的啟用值以一定的概率p，讓其停止工作，這次訓練過程中不更新

Tensorflow學習筆記（用哪學哪)tf.nn.dropout

tf.nn.dropout(x, keep_prob, noise_shape=None, seed=None, name=None) 根據給出的keep_prob引數，將輸入tensor x按比例輸出。預設情況下, 每個元素儲存或丟棄都是獨立的 x

Tensorflow學習筆記(2)：tf.nn.dropout 與 tf.layers.dropout

You want to use the dropout() function in tensorflow.contrib.layers, not the one in tensorflow.nn. The only differences in the two funct

【轉載】TensorFlow學習---tf.nn.dropout防止過擬合

轉載自：http://blog.csdn.net/huahuazhu/article/details/73649389 尊重原創遇到tf.nn.dropout問題時，在網上看到這篇博文，覺得不錯，所以轉載方便自己以後學習，如侵犯版權，請告知博主刪除一、 Dropout原理簡述： tf.nn.drop

Tensorflow學習筆記之tf.nn.relu

Tensorflow學習筆記之tf.nn.relu 關於Tensorflow的學習筆記大部分為其他部落格或者書籍轉載，只為督促自己學習。線性整流函式（Rectified Linear Unit，ReLU），又稱修正線性單元。其定義如下圖，在橫座標的右側，ReLU函式為線性函式。在橫座標

dropout與tf.nn.dropout

轉載自：https://blog.csdn.net/huahuazhu/article/details/73649389?utm_source=copy 一、 Dropout原理簡述： tf.nn.dropout是TensorFlow裡面為了防止或減輕過擬合而使用的函式，它一般用在全連線

Tensorflow 損失函式及學習率的四種改變形式

Reference: https://blog.csdn.net/marsjhao/article/details/72630147 分類問題損失函式-交叉熵（crossentropy) 交叉熵描述的是兩個概率分佈之間的距離，分類中廣泛使用的損失函式

tf.nn.conv2d函式和tf.nn.max_pool函式介紹

tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, name=None) 介紹引數： input：指卷積需要輸入的引數，具有這樣的shape[batch, in_height, in_width, in_c

tf.nn.dropout

表示輸出 pro 元素隨機擬合 sha keep 每一個 tf.nn.dropout(x, keep_prob, noise_shape=None, seed=None, name=None) 此函數是為了防止在訓練中過擬合的操作，將訓練輸出按一定規則進行變換. 參數

tf.nn.dropout 的作用

我們都是到dropout 為了防止過擬合而隨機抑制神經元，即（1）將featuremap 某些神經元按概率設定為0 （2）不被抑制的神經元變為 1/pro 倍在tensroflow 中 tf.nn.dropout（X，pro）主要含兩個變數，輸入張量X和概率值p

tensorflow啟用函式relu()的詳解

tf.nn.relu(features, name = None)解釋：這個函式的作用是計算啟用函式relu，即max(features, 0)。即將矩陣中每行的非最大值置0。#!/usr/bin/env python # -*- coding: utf-8 -*- impo

TensorFlow啟用函式+歸一化-函式

啟用函式的作用如下-引用《TensorFlow實踐》：這些函式與其他層的輸出聯合使用可以生成特徵圖。他們用於對某些運算的結果進行平滑或者微分。其目標是為神經網路引入非線性。曲線能夠刻畫出輸入的複雜的變化。TensorFlow提供了多種啟用函式，在CNN中一般使用tf.

tensorflow-啟用函式及tf.nn.dropout

啟用函式

dropout函式

相關推薦