深度學習-啟用函式

阿新 • • 發佈：2018-12-18

啟用函式總結

作用： 啟用函式給神經元引入了非線性因素，使得神經網路可以任意逼近任何非線性函式，這樣神經網路就可以應用到眾多的非線性模型中

在這裡插入圖片描述

啟用函式圖

sigmod函式（Logistic函式）

公式

$f(x)=\cfrac{1}{1+e^x}$
求導 $f(x)' = f(x)(1-f(x))$
優點：
1. Sigmoid函式的輸出對映在(0,1)之間，單調連續，輸出範圍有限，優化穩定，可以用作輸出層
2. 求導容易
缺點：
1. 由於其軟飽和性，容易產生梯度消失，導致訓練出現問題
2. 其輸出並不是以0為中心的，使權重更新效率降低
3. sigmod函式要進行指數運算，這個對於計算機來說是比較慢的
4. sigmod函式飽和性：啟用函式計算量大，反向傳播求誤差梯度時，求導涉及除法反向傳播時，很容易就會出現梯度消失的情況，從而無法完成深層網路的訓練

tanh函式（雙曲正切函式）

簡介：tanh是雙曲正切函式，tanh函式和sigmod函式的曲線是比較相近的，咱們來比較一下看看。首先相同的是，這兩個函式在輸入很大或是很小的時候，輸出都幾乎平滑，梯度很小，不利於權重更新；不同的是輸出區間，tanh的輸出區間是在(-1,1)之間，而且整個函式是以0為中心的，這個特點比sigmod的好
公式

$tanh(x)=\cfrac{sinh(x)}{cosh(x)}=\cfrac{e^x-e^{-x}}{e^x+e^{-x}}$
其中： $sinh(x)=\cfrac{e^x-e^{-x}}{2}$ $cosh(x)=\cfrac{e^x+e^{-x}}{2}$ $sin(x)=i·sinh(x)$ $cos(i·x)=cosh(x)$
求導 $f(x)'=1-f(x)^2$
優點：

比Sigmoid函式收斂速度更快
相比Sigmoid函式，其輸出以0為中心

缺點：
- 還是沒有改變Sigmoid函式的最大問題——由於飽和性產生的梯度消失
用法：
- 一般二分類問題中，隱藏層用tanh函式，輸出層用sigmod函式

Relu函式（線性整流函式）

公式 $f(x)=max(0,x)$
求導

$f(x)'=\begin{cases} 0, x<0 \\ 1, x>0 \end{cases}$
優點
1. 在輸入為正數的時候，不存在梯度飽和問題。
2. 計算速度要快很多。ReLU函式只有線性關係，不管是前向傳播還是反向傳播，都比sigmod和tanh要快很多。（sigmod和tanh要計算指數，計算速度會比較慢）
缺點
1. 當輸入是負數的時候，ReLU是完全不被啟用的，這就表明一旦輸入到了負數，ReLU就會死掉。這樣在前向傳播過程中，還不算什麼問題，有的區域是敏感的，有的是不敏感的。但是到了反向傳播過程中，輸入負數，梯度就會完全到0，這個和sigmod函式、tanh函式有一樣的問題
2. 我們發現ReLU函式的輸出要麼是0，要麼是正數，這也就是說，ReLU函式也不是以0為中心的函式

code

import matplotlib.pyplot as plt
import numpy as np

x = np.linspace(-10,10)
y_sigmoid = 1/(1+np.exp(-x))
y_sigmoid_d = y_sigmoid*(1-y_sigmoid)
y_tanh = (np.exp(x)-np.exp(-x))/(np.exp(x)+np.exp(-x))
y_tanh_d = 1-y_tanh*y_tanh
y_relu = np.array([0*item  if item<0 else item for item in x ]) 
y_relu_d = np.array([0*item  if item<0 else 1 for item in x ]) 

fig = plt.figure()
# plot sigmoid
ax = fig.add_subplot(321)
ax.plot(x,y_sigmoid)
ax.grid()
ax.set_title('Sigmoid')

# plot sigmoid_d
ax = fig.add_subplot(322)
ax.plot(x,y_sigmoid_d)
ax.grid()
ax.set_title('sigmoid_d')

# plot tanh
ax = fig.add_subplot(323)
ax.plot(x,y_tanh)
ax.grid()
ax.set_title('y_tanh')

# plot tanh
ax = fig.add_subplot(324)
ax.plot(x,y_tanh_d)
ax.grid()
ax.set_title('y_tanh_d')

# plot relu
ax = fig.add_subplot(325)
ax.plot(x,y_relu)
ax.grid()
ax.set_title('ReLu')



# plot relu
ax = fig.add_subplot(326)
ax.plot(x,y_relu_d)
ax.grid()
ax.set_title('ReLu_d')

#plot leaky relu
# ax = fig.add_subplot(121)
# y_relu = np.array([0.2*item  if item<0 else item for item in x ]) 
# ax.plot(x,y_relu)
# ax.grid()
# ax.set_title('Leaky ReLu')
# #plot leaky relu
# ax = fig.add_subplot(122)
# y_relu = np.array([0  if item<0 else 1 for item in x ]) 
# ax.plot(x,y_relu)
# ax.grid()
# ax.set_title('Leaky ReLu d')

plt.tight_layout()
plt.savefig('att_d.jpg')
plt.show()

深度學習啟用函式sigmoid,tanh,ReLU,softma詳解

啟用函式sigmoid,tanh,ReLU,softma詳解 [轉載地址：](https://blog.csdn.net/u011684265/article/details/78039280) # **啟用函式sigmoid,tanh,ReLU,softmax**

深度學習-啟用函式

啟用函式總結作用：啟用函式給神經元引入了非線性因素，使得神經網路可以任意逼近任何非線性函式，這樣神經網路就可以應用到眾多的非線性模型中啟用函式圖 sigmod函式（Logis

深度學習---啟用函式

　　在說常用的啟用函式之前，先看一下生物神經元與人工神經元之間的啟用函式的區別。　　在生物神經元中，啟用函式的作用為：是否相應上一個神經元，如果響應比較大，則啟用下一個神經元，往下以此傳遞。而人工神經元中的啟用函式，又成為“非線性對映函式”，它並不是去啟用什

深度學習——啟用函式Sigmoid/Tanh/ReLU

啟用函式(Activation Function)的特點：非線性：當啟用函式是線性的時候，一個兩層的神經網路就可以逼近基本上所有的函數了。可微：當優化方法是基於梯度的時候，這個性質是必須的。單

【讀書1】【2017】MATLAB與深度學習——ReLU函式(1)

ReLU函式（ReLU Function）本節通過例項介紹ReLU函式。 This section introduces the ReLU functionvia the example. DeepReLU函式利用反向傳播演算法對給定的深度神經網路進行訓練。 The fun

【讀書1】【2017】MATLAB與深度學習——ReLU函式(2)

該部分程式碼從輸出節點的增量開始，計算隱藏節點的輸出誤差，並將其用於下一次誤差的計算。 This process starts from the delta of theoutput node, calculates the error of the hidden node, and u

機器學習-啟用函式

啟用函式啟用函式是作用於神經網路神經元輸出的函式。只有加入了非線性啟用函式之後，深度神經網路才具備了分層的非線性對映學習能力，常用的啟用函式如下圖所示。 linear為線性啟用函式，表示式為，用於迴歸神經網路輸出（或二分類問題）； sigmoid為非線性啟用函式，用於隱層

Python深度學習魔法函式len及getitem

對於魔法函式__len__來說它可以使我們對於一個類的例項使用len()方法, __getitem__方法則可以像列表一樣操作 class Person: def __init__(self

【讀書1】【2017】MATLAB與深度學習——代價函式與學習規則(1)

代價函式與學習規則（Cost Function and Learning Rule）本節簡要說明了代價函式是什麼，以及它如何影響神經網路的學習規則。 This section briefly explains what the costfunction is

【讀書1】【2017】MATLAB與深度學習——代價函式比較(2)

如果你覺得很難趕上學習進度，不要氣餒。 If you had a hard time catching on, don’tbe discouraged. 事實上，在研究深度學習時，理解反向傳播演算法並不是一個至關重要的因素。 Actually, understa

深度學習優化函式詳解（5）-- Nesterov accelerated gradient (NAG)

深度學習優化函式詳解系列目錄上一篇文章講解了猶如小球自動滾動下山的動量法（momentum）這篇文章將介紹一種更加“聰明”的滾動下山的方式。動量法每下降一步都是由前面下降方向的一個累積和當前點的梯度方向組合而成。於是一位大神（Nesterov）就開始思考，

卷積神經網路學習--啟用函式

這篇學習筆記主要參考和綜合了兩個帖子的內容，詳見參考文件，感謝兩位大神。 1 什麼是啟用函式？啟用函式，並不是去啟用什麼，而是指如何把“啟用的神經元的特徵”通過函式把特徵保留並映射出來（保留特徵，去除一些資料中是的冗餘），這是神經網路能解決非線性問題關鍵。目前知道的啟

【讀書1】【2017】MATLAB與深度學習——代價函式比較(1)

該程式的撰寫方式幾乎與第2章“SGD與批處理比較”中的SGDvsBatch.m檔案的撰寫方式相同。 The architecture of this file is almostidentical to that of the SGDvsBatch.m file

深度學習：卷積神經網路，卷積，啟用函式，池化

卷積神經網路——輸入層、卷積層、啟用函式、池化層、全連線層 https://blog.csdn.net/yjl9122/article/details/70198357?utm_source=blogxgwz3 一、卷積層特徵提取輸入影象是32*32*3，3是它的深度（即R

深度學習幾種主流啟用函式總結

啟用函式的定義加拿大蒙特利爾大學的Bengio教授在 ICML 2016 的文章[1]中給出了啟用函式的定義：啟用函式是對映 h:R→R，且幾乎處處可導。啟用函式的性質非線性：當啟用函式是線性的時候，一個兩層的神經網路就可以逼近基本上所有的函數了。但是，如果啟

深度學習基礎--loss與啟用函式--廣義線性模型與各種各樣的啟用函式(配圖)

廣義線性模型是怎被應用在深度學習中? 深度學習從統計學角度，可以看做遞迴的廣義線性模型。廣義線性模型相對於經典的線性模型(y=wx+b)，核心在於引入了連線函式g(.)，形式變為：y=g(wx+b)。深度學習時遞迴的廣義線性模型，神經元的啟用函式，即為廣義線性模型的連結函式

深度學習基礎--loss與啟用函式--Relu的變種

Relu的變種 softplus/softrelu softplus 是對 ReLU 的平滑逼近的解析函式形式。 softplus的公式： f(x)=ln(1+e^x) Relu與PRelu ai是增加的引數，ai=0；為ReLU，若ai取很小的固定值，則為

深度學習基礎--loss與啟用函式--Relu(Rectified Linear Units)

ReLu(Rectified Linear Units)，即修正線性單元它是不飽和的、線性的函式。可以認為是一種特殊的maxout。 Relu的優點 1）採用sigmoid和tanh等函式，算啟用函式時（指數運算），計算量大，反向傳播求誤差梯度時，求導涉及除法，計算量相

深度學習基礎--loss與啟用函式--好的啟用函式的性質

好的啟用函式的性質 1）不會飽和。sigmoid和tanh啟用函式在兩側尾端會有飽和現象，這會使導數在這些區域接近零，從而阻礙網路的訓練。 2）零均值。ReLU啟用函式的輸出均值不為零，這會影響網路的訓練。 3）容易計算。使用：最好不要用 sigmoid，你可以試試

深度學習基礎--loss與啟用函式--感知損失(Perceptual Loss)

感知損失(Perceptual Loss) 常用於GAN網路生成。 Perceptual Loss的出現證明了一個訓練好的CNN網路的feature map可以很好的作為影象生成中的損失函式的輔助工具。 GAN可以利用監督學習來強化生成網路的效果。其效果的原因雖然還不具可解釋

深度學習-啟用函式

啟用函式總結

sigmod函式（Logistic函式）

tanh函式（雙曲正切函式）

Relu函式（線性整流函式）

code

相關推薦