使用交叉熵作為代價函式

阿新 • • 發佈：2019-02-07

二次代價函式（quadratic cost）：

這裡寫圖片描述

其中，C表示代價函式，x表示樣本，y表示實際值，a表示輸出值，n表示樣本的總數。

例如：

這裡寫圖片描述

假如我們使用梯度下降法（Gradient descent）來調整權值引數的大小，權值w和偏置b的梯度推導如下：

這裡寫圖片描述

其中，z表示神經元的輸入。w和b的梯度跟啟用函式的梯度成正比，啟用函式的梯度越大，w和b的大小調整得越快，訓練收斂得就越快。

假設我們的啟用函式是sigmoid函式：

這裡寫圖片描述

假如我們目標是收斂到1。A點為0.82離目標比較遠，梯度比較大，權值調整比較大。B點為0.98離目標比較近，梯度比較小，權值調整比較小。調整方案合理。
假如我們目標是收斂到0。A點為0.82離目標比較近，梯度比較大，權值調整比較大。B點為0.98離目標比較遠，梯度比較小，權值調整比較小。調整方案不合理。

交叉熵代價函式（cross-entropy）：

換一個思路，我們不改變啟用函式，而是改變代價函式，改用交叉熵代價函式：

這裡寫圖片描述

其中，C表示代價函式，x表示樣本，y表示實際值，a表示輸出值，n表示樣本的總數。

這裡寫圖片描述

權值和偏置值的調整與無關。另外，梯度公式中表示輸出值與實際值的誤差。所以當誤差越大時，梯度就越大，引數w和b的調整就越快，訓練的速度也就越快。
如果輸出神經元是線性的，那麼二次代價函式就是一種合適的選擇。如果輸出神經元是s型函式，那麼比較適合用交叉熵代價函式。

對數釋然代價函式（log-likelihood cost）：

對數釋然函式通常用來作為softmax迴歸的代價函式，如果輸出層神經元是sigmoid函式，可以採用交叉熵代價函式。而深度學習中更普遍的做法是將softmax作為最後一層，此時常用的代價函式是對數釋然函式。

對數釋然函式與softmax的組合和交叉熵與sigmoid函式的組合非常相似。對數釋然代價函式在二分類時可以化簡為交叉熵代價函式的形式。

在TensorFlow中用：
tf.nn.sigmoid_cross_entropy_with_logits()來表示跟sigmoid搭配使用的交叉熵。
tf.nn.softmax_cross_entropy_with_logits()來表示跟softmax搭配使用的交叉熵。

深度學習框架TensorFlow學習與應用（三）——使用交叉熵作為代價函式

二次代價函式（quadratic cost）：其中，C表示代價函式，x表示樣本，y表示實際值，a表示輸出值，n表示樣本的總數。例如：假如我們使用梯度下降法（Gradient descent）來調整權值引數的大小，權值w和偏置b的梯

交叉熵以及為什麼用交叉熵作為代價函式

作者：知乎使用者來源：知乎著作權歸作者所有。商業轉載請聯絡作者獲得授權，非商業轉載請註明出處。熵的本質是夏農資訊量()的期望。現有關於樣本集的2個概率分佈p和q，其中p為真實分佈，q非真實分佈。按照真實分佈p來衡量識別一個樣本的所需要的編碼長度的期望(即平均編碼長度)為：H(

使用交叉熵作為代價函式

二次代價函式（quadratic cost）：其中，C表示代價函式，x表示樣本，y表示實際值，a表示輸出值，n表示樣本的總數。例如：假如我們使用梯度下降法（Gradient descent）來調整權值引數的大小，權值w和偏置b的梯度推導如下：

為什麼用交叉熵作為損失函式

交叉熵(cross entropy)經常用來做機器學習中的損失函式。要講交叉熵就要從最基本的資訊熵說起。 1.資訊熵資訊熵是消除不確定性所需資訊量的度量。（多看幾遍這句話）資訊熵就是資訊的不確定程度，資訊熵越小，資訊越確定。信息熵=∑x=1n(信息x發生

理解交叉熵作為損失函式在神經網路中的作用

交叉熵的作用通過神經網路解決多分類問題時，最常用的一種方式就是在最後一層設定n個輸出節點，無論在淺層神經網路還是在CNN中都是如此，比如，在AlexNet中最後的輸出層有1000個節點：而即便是ResNet取消了全連線層，也會在最後有一個1000個節

資訊量，熵，交叉熵，相對熵與代價函式

1. 資訊量資訊的量化計算：解釋如下：資訊量的大小應該可以衡量事件發生的“驚訝程度”或不確定性：如果有⼈告訴我們⼀個相當不可能的事件發⽣了，我們收到的資訊要多於我們被告知某個很可能發⽣的事件發⽣時收到的資訊。如果我們知道某件事情⼀定會發⽣，那麼我們就不會接收到資訊。也就是說，

交叉熵與softmax函式

交叉熵與softmax函式在神經網路中，在對超引數進行優化過程當中，需要有一個優化的目標值，也就是真實值與預測值之間的差距要儘量小，差距越小說明預測越精確。這個差距往往用loss表示在分類問題當中，我們用交叉熵來表示這個loss值。 1. 熵的概念熵是物理學中的一個名詞

交叉熵在loss函式中使用的理解

交叉熵（cross entropy）是深度學習中常用的一個概念，一般用來求目標與預測值之間的差距。以前做一些分類問題的時候，沒有過多的注意，直接呼叫現成的庫，用起來也比較方便。最近開始研究起對抗生成網路（GANs），用到了交叉熵，發現自己對交叉熵的理解有些模糊，不夠深入。遂花了幾天的時間從頭梳理了一下相關

機器學習基礎（六）—— 交叉熵代價函式（cross-entropy error）

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

交叉熵代價函式（cross-entropy cost function）

1.從方差代價函式說起代價函式經常用方差代價函式（即採用均方誤差MSE），比如對於一個神經元（單輸入單輸出，sigmoid函式）,定義其代價函式為：其中y是我們期望的輸出，a為神經元的實際輸出【 a=σ(z), where z=wx+b 】。在訓練神經網路過程中，我

深度學習基礎--loss與啟用函式--sigmiod與softmax；對數損失函式與交叉熵代價函式

sigmiod與softmax sigmiod就是邏輯迴歸（解決二分類問題）；softmax是多分類問題的邏輯迴歸雖然邏輯迴歸能夠用於分類，不過其本質還是線性迴歸。它僅線上性迴歸的基礎上，在特徵到結果的對映中加入了一層sigmoid函式（非線性）對映，即先把特徵線性求和，然後使

深度學習框架tensorflow學習與應用5（softmax函式+交叉熵代價函式和二次代價函式的比較）

import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data # In[3]: #載入資料集 mnist = input_data.read_data_sets("MNIST_data",o

神經網路代價函式與交叉熵

在此我們以MSE作為代價函式：

交叉熵代價函式（作用及公式推導）

交叉熵代價函式（Cross-entropy cost function）是用來衡量人工神經網路（ANN）的預測值與實際值的一種方式。與二次代價函式相比，它能更有效地促進ANN的訓練。

五、改進神經網路的學習方法（1）：交叉熵代價函式

本部落格主要內容為圖書《神經網路與深度學習》和National Taiwan University (NTU)林軒田老師的《Machine Learning》的學習筆記，因此在全文中對它們多次引用。初出茅廬，學藝不精，有不足之處還望大家不吝賜教。

為什麼交叉熵可以作為損失函式？

通俗的理解：熵：可以表示一個事件Ａ的自資訊量，就是Ａ包含多少資訊。ＫＬ散度：可以用來表示從事件Ａ的角度來看，事件Ｂ有多大不同。交叉熵：可以用來表示從事件Ａ的角度來看，如何描述事件Ｂ。熵的公式：

理解交叉熵(cross_entropy)作為損失函式在神經網路中的作用

交叉熵的作用通過神經網路解決多分類問題時，最常用的一種方式就是在最後一層設定n個輸出節點，無論在淺層神經網路還是在CNN中都是如此，比如，在AlexNet中最後的輸出層有1000個節點：而即便是ResNet取消了全連線層，也會在最後有一個1000個節點的輸出層：一般情況下

交叉熵H(p||q)代價函式

轉載地址：http://blog.csdn.net/u012162613/article/details/44239919 1.從方差代價函式說起代價函式經常用方差代價函式（即採用均方誤差MSE），比如對於一個神經元（單輸入單輸出，sigmoid函式）,定義

交叉熵代價函式（作用及公式推導

交叉熵代價函式（Cross-entropy cost function）是用來衡量人工神經網路（ANN）的預測值與實際值的一種方式。與二次代價函式相比，它能更有效地促進ANN的訓練。在介紹交叉熵代價函式之前，本文先簡要介紹二次代價函式，以及其存在的不足。 1. 二次

使用交叉熵作為代價函式

二次代價函式（quadratic cost）：

交叉熵代價函式（cross-entropy）：

對數釋然代價函式（log-likelihood cost）：

相關推薦