Tensorflow深度學習之五：啟用函式

阿新 • • 發佈：2019-02-18

啟用函式的作用

在神經網路中，啟用函式的作用是能夠給神經網路加入一些非線性因素，使得神經網路可以更好地解決較為複雜的問題。
我們嘗試引入非線性的因素，對樣本進行分類。

在神經網路中也類似，我們需要引入一些非線性的因素，來更好地解決複雜的問題。而啟用函式恰好就是那個能夠幫助我們引入非線性因素的存在，使得我們的神經網路能夠更好地解決較為複雜的問題。

常見的啟用函式有Sigmoid，Relu，tanh等。
關於上述函式的公式，在此不贅述。

Sigmoid函式如下：

tanh函式如下：
這裡寫圖片描述

Relu函式如下：
這裡寫圖片描述

在Tensorflow中使用啟用函式
以Relu函式為例：

import tensorflow as tf

# 預設Tensorflow會話 

sess = tf.InteractiveSession()

# Relu函式處理負數
print("anwser 1:",tf.nn.relu(-2.9).eval())
# Relu函式處理正數
print("anwser 2:",tf.nn.relu(3.4).eval())

# 產生一個4x4的矩陣，滿足均值為0，標準差為1的正態分佈
a = tf.Variable(tf.random_normal([4,4],mean=0.0, stddev=1.0))

# 對所有變數進行初始化，這裡對a進行初始化
tf.global_variables_initializer().run()

# 輸出原始的a的值 

print("原始矩陣:\n",a.eval())

# 對a使用Relu函式進行啟用處理，將結果儲存到b中
b = tf.nn.relu(a)

# 輸出處理後的a，即b的值
print("Relu函式啟用後的矩陣:\n",b.eval())

結果如下：（由於不同的機器，執行結果會有不同）

anwser 1: 0.0
anwser 2: 3.4
原始矩陣:
 [[-0.42271236  0.70626765  0.4220579  -1.19738662]
 [-0.09090481  1.20085275 -1.37331688 -0.28922254]
 [-0.63343877  0.04532439 -0.98322827 -0.01032094]
 [ 0.364104    1.00423157  0.23247592 -1.13028443]] 

Relu函式啟用後的矩陣:
 [[ 0.          0.70626765  0.4220579   0.        ]
 [ 0.          1.20085275  0.          0.        ]
 [ 0.          0.04532439  0.          0.        ]
 [ 0.364104    1.00423157  0.23247592  0.        ]]

可以發現，對於輸入是一個數字來說，輸出滿足公式。對於輸入引數是一個矩陣的情況，relu函式對矩陣中的每一個數字均使用了Relu函式進行處理，負數直接變為0.0，正數保持不變。

其他的啟用函式亦是如此。

Tensorflow深度學習之五：啟用函式

啟用函式的作用在神經網路中，啟用函式的作用是能夠給神經網路加入一些非線性因素，使得神經網路可以更好地解決較為複雜的問題。我們嘗試引入非線性的因素，對樣本進行分類。在神經網路中也類似，我們需要引入一些非線性的因素，來更好地解決複雜的問題。而啟用函式恰好

六天搞懂“深度學習”之五：深度學習

簡單地說，深度學習就是一種採用深度神經網路的機器學習技術，深度神經網路就是一種包含2個或者2個以上隱藏層的多層神經網路。這裡再次簡單回顧一下“深度學習”的發展歷史： l 第一代神經網路——單層神經網路，在解決機器學習面臨的實際問題時，很快就暴露出它的基本侷限性，單層神經網路只

Tensorflow深度學習之七：再談mnist手寫數字識別程式

之前學習的第一個深度學習的程式就是mnist手寫字型的識別，那個時候對於很多概念不是很理解，現在回過頭再看當時的程式碼，理解了很多，現將加了註釋的程式碼貼上，與大家分享。（本人還是在學習Tensorflow的初始階段，如果有什麼地方理解有誤，還請大家不吝指出。）

深度學習之五：序列模型與詞向量

1 迴圈序列模型 1.1 序列模型的適用範圍序列模型是一種用於處理序列資料的模型，它可以用於語音識別，音樂生成，情感分類，機器翻譯，命名實體識別等。模型的輸出也可能是一個序列。 1.2 相關的符號約定 x<k>x<k>

深度學習筆記(三)：啟用函式和損失函式

這一部分來探討下啟用函式和損失函式。在之前的logistic和神經網路中，啟用函式是sigmoid, 損失函式是平方函式。但是這並不是固定的。事實上，這兩部分都有很多其他不錯的選項，下面來一一討論 3. 啟用函式和損失函式 3.1 啟

Tensorflow深度學習之十二：基礎圖像處理之二

fcm 數字 ssi port con tty .net term file Tensorflow深度學習之十二：基礎圖像處理之二 from：https://blog.csdn.net/davincil/article/details/76598474 首先放出

Tensorflow深度學習之三十三：tf.scatter_update

一、tf.scatter_update tf.scatter_update( ref, indices, updates, use_locking=True, name=None ) Applies sparse

Tensorflow深度學習之十二：基礎影象處理之二

首先放出原始影象： 1、影象的翻轉 import tensorflow as tf import cv2 # 這裡定義一個tensorflow讀取的圖片格式轉換為opencv讀取的圖片格式的函式 # 請注意： # 在tensorflow中，一個畫素

Tensorflow深度學習之十一：基礎影象處理

OpenCV是一個十分強大的視覺庫，tensorflow也提供了十分強大的圖片處理函式，下面是一個簡單的例子來說明使用tensorflow和opencv兩個工具進行深度學習程式的設計。首先是使用的原始圖片： import tensorflow as

Tensorflow深度學習之二十一：LeNet的實現（CIFAR-10資料集）

一、LeNet的簡介 LeNet是一個用來識別手寫數字的最經典的卷積神經網路，是Yann LeCun在1998年設計並提出的。Lenet的網路結構規模較小，但包含了卷積層、池化層、全連線層，他們都構成了現代CNN的基本元件。 LeNet包含輸入層在內共有

Tensorflow深度學習之二十二：AlexNet的實現（CIFAR-10資料集）

二、工程結構由於我自己訓練的機器記憶體視訊記憶體不足，不能一次性讀取10000張圖片，因此，在這之前我按照圖片的類別，將每一張圖片都提取了出來，儲存成了jpg格式。與此同時，在儲存圖片的過程中，儲存了一個python的dict結構，鍵為每一張圖片的相對地

Tensorflow深度學習之十九：矩陣切片與連結

1、TensorFlow矩陣切片操作：tf.slice函式函式原型：slice(input_, begin, size, name=None) 引數： input：待切片的矩陣tensor。 begin：起始位置，表示從哪一個資料開始進行切片。這個起始

Tensorflow深度學習之十四：Tensorflow變數管理

宣告：本篇文章參考《Tensorflow實戰Google深度學習框架》一書 Tensorflow提供了通過變數名稱來建立或者獲取一個變數的機制。通過這個機制，在不同的函式中可以直接通過變數的名字來使用變數，而不需要將變數通過引數的形式到處傳遞。 Tensor

Tensorflow深度學習之二十七：tf.nn.conv1d

一、conv1d 在NLP領域，甚至影象處理的時候，我們可能會用到一維卷積（conv1d）。所謂的一維卷積可以看作是二維卷積（conv2d）的簡化，二維卷積是將一個特徵圖在width和height兩個方向上進行滑窗操作，對應位置進行相乘並求和；而一維卷積則

Tensorflow深度學習之三十二： tf.scatter_nd_update

一、tf.scatter_nd_update 函式定義： tf.scatter_nd_update( ref, indices, updates, use_locking=True, name=None )

tensorflow原始碼學習之五 -- 同步訓練和非同步訓練

同步和非同步訓練是由optimizer來決定的。 1. 同步訓練同步訓練需要使用SyncReplicasOptimizer，參考https://www.tensorflow.org

深度學習幾種主流啟用函式總結

啟用函式的定義加拿大蒙特利爾大學的Bengio教授在 ICML 2016 的文章[1]中給出了啟用函式的定義：啟用函式是對映 h:R→R，且幾乎處處可導。啟用函式的性質非線性：當啟用函式是線性的時候，一個兩層的神經網路就可以逼近基本上所有的函數了。但是，如果啟

深度學習基礎--loss與啟用函式--廣義線性模型與各種各樣的啟用函式(配圖)

廣義線性模型是怎被應用在深度學習中? 深度學習從統計學角度，可以看做遞迴的廣義線性模型。廣義線性模型相對於經典的線性模型(y=wx+b)，核心在於引入了連線函式g(.)，形式變為：y=g(wx+b)。深度學習時遞迴的廣義線性模型，神經元的啟用函式，即為廣義線性模型的連結函式

深度學習基礎--loss與啟用函式--Relu的變種

Relu的變種 softplus/softrelu softplus 是對 ReLU 的平滑逼近的解析函式形式。 softplus的公式： f(x)=ln(1+e^x) Relu與PRelu ai是增加的引數，ai=0；為ReLU，若ai取很小的固定值，則為

深度學習基礎--loss與啟用函式--Relu(Rectified Linear Units)

ReLu(Rectified Linear Units)，即修正線性單元它是不飽和的、線性的函式。可以認為是一種特殊的maxout。 Relu的優點 1）採用sigmoid和tanh等函式，算啟用函式時（指數運算），計算量大，反向傳播求誤差梯度時，求導涉及除法，計算量相

Tensorflow深度學習之五：啟用函式

相關推薦