熵，相對熵和互資訊

1.熵.熵表示隨機變數不確定度的度量。也是平均意義上描述隨機變數所需要資訊量的度量。一個離散型隨機變數的熵H(X)定義為：

H(X)=−∑x∈Xp(x)logp(x)
對數的底數通常為2，熵的單位是位元，同時也可以是e來表示。用統計學來解釋就是函式g(x)=log1p(x)關於密度函式p(x)的期望
Ep(g(x))=H(X)
2.聯合熵與條件熵.對於服從聯合分佈為p(x,y)的一對離散隨機變數(X,Y),其聯合熵H(X,Y)的定義為
H(X,Y)=−∑x∈X∑y∈Yp(x,y)logp(x,y)
相似的，條件熵為
H(Y|X)=∑x∈Xp(x)H(Y|X=x)=−Ep(x,

y)logp(Y|X)
條件熵就是f(y|x)的關於X和Y的聯合分佈對數的負期望。所以我們很容易得到關於聯合熵和條件熵的鏈式法則
H(X,Y)=H(X)+H(Y|X)
3.相對熵與互信息.相對熵表示兩個隨機分佈之間距離的度量,或者說是兩者之間的差異。相對熵D(p||q)度量當真實分佈為p而假定分佈是q時的無效性。換句話說，針對真是分佈為p，可以構造描述長度為H(p)的碼。但是如果使用針對q的碼的話，在平均意義上就是需要H(p)+D(p||q)位元來描述這個隨機變數.
兩個概率密度函式為p(x)和q(x)之間的相對熵為
D(p||q)=∑x∈Xp(x)logp(x)q(x)
互信息是隨機變數包含另一個隨機變數資訊量的度量。互資訊也是在給定另一個隨機變數情況下，原隨機變數不確定度的縮減量
I

(X;Y)=∑x∈X∑y∈Xp(x,y)logp(x,y)p(x)p(y)
理解著很簡單，如果兩個隨機變數之間是相互獨立的，那麼他們之間相互解釋的部分就是為零，所以互資訊為零，如果兩個隨機變數之間相關的，那麼互資訊為正，兩者由相互解釋的部分。
4.熵與互信息的關系.
I(X,Y)=H(X)−H(X|Y)=H(Y)−H(Y|X)
X包含Y的資訊和Y包含X的資訊量是相同的。
下圖描述了熵和互資訊之間的關係

5.熵,相對熵與互信息的鏈式法則.一組隨機變數的熵等於條件熵之和。設隨機變數X1,X2,...,

熵，相對熵和互資訊

熵，相對熵和互資訊

資訊理論複習筆記（1）：資訊熵、條件熵，聯合熵，互資訊、交叉熵，相對熵

熵模型—— 熵，條件熵，聯合熵，相對熵，互資訊及其關係，最大熵模型。。

熵，條件熵，相對熵，互資訊的相關定義及公式推導

資訊量，熵，交叉熵，相對熵與代價函式

最大似然估計，交叉熵，相對熵(KL散度)

資訊熵、交叉熵與相對熵(KL散度)的關係，還介紹了聯合資訊熵和條件熵、互資訊（資訊增益）的概念

特徵選擇-熵和互資訊

熵、聯合熵、條件熵、相對熵、交叉熵、互資訊

資訊熵（夏農熵），相對熵（KL散度），交叉熵三者的對比以及吉布斯不等式

資訊熵，條件熵，互資訊的通俗理解

關於資訊理論中熵、相對熵、、條件熵、互資訊、典型集的一些思考

熵、聯和熵與條件熵、交叉熵與相對熵是什麼呢？詳細解讀這裡有！

信息熵，交叉熵，KL散度

通俗的解釋交叉熵與相對熵

AI機器學習-信息熵，條件熵，信息增益

Python基礎學習——讀取檔案，相對路徑和絕對路徑

還有很多行業，並沒有和互聯網相加

錨點，相對路徑和絕對路徑

定位的分類，相對定位和絕對定位的總結

熵，相對熵和互資訊

相關推薦