互資訊（Mutual Information）的介紹

阿新 • • 發佈：2018-12-13

概念

互資訊，Mutual Information，縮寫為MI，表示兩個變數X與Y是否有關係，以及關係的強弱。

公式

我們定義互資訊的公式為：

I(X,Y)=∫X∫YP(X,Y)logP(X,Y)P(X)P(Y)

可以看出，如果X與Y獨立，則P(X,Y)=P(X)P(Y)，I(X,Y)就為0，即代表X與Y不相關

解析公式

I(X;Y)=∫X∫YP(X,Y)logP(X,Y)P(X)P(Y)=∫X∫YP(X,Y)logP(X,Y)P(X)−∫X∫YP(X,Y)logP(Y)=∫X∫YP(X)P(Y|X)logP(Y|X)−∫Ylog

Y的熵指的是衡量的是Y的不確定度，Y分佈得越離散，H(Y)的值越高

H(Y|X)則表示在已知X的情況下，Y的不確定度

所以，根據互資訊公式的變形： I(X,Y)=H(Y)−H(Y|X)

可以看出，I(X,Y)可以解釋為由X引入而使Y的不確定度減小的量，這個減小的量為H(Y|X)

所以，如果X,Y關係越密切，I(X,Y)就越大

I(X,Y)最大的取值是H(Y)H(Y)，此時H(Y|X)為0，意義為X和Y完全相關，在X確定的情況下Y是個定值，沒有出現其他不確定情況的概率，所以為H(Y|X)為0

I(X,Y)取0時，代表X與Y獨立，此時H(Y)=H(Y|X)，意義為X的出現不影響Y。。

性質

I(X;Y)I(X;Y)的性質： 1）I(X;Y)⩾0 ，I(X;Y)⩾0 2）H(X)−H(X|Y)=I(X;Y)=I(Y;X)=H(Y)−H(Y|X)H(X)−H(X|Y)=I(X;Y)=I(Y;X)=H(Y)−H(Y|X) 3）當X,Y獨立時，I(X;Y)=0，I(X;Y)=0 4）當X,Y知道一個就能推斷另一個時，I(X;Y)=H(X)=H(Y)

缺點

在做文字分類時，我們可能會判斷一個詞和某類的相關程度，但是計算時，未考慮詞頻的影響（可以讓互資訊的結果再乘上tf-idf因子，從而將特徵頻率與特徵分佈考慮進去）

應用

1、文字自動摘要 2、兩個詞語同時出現的概率 PMI（點互資訊），通過判斷一個詞分別與poor和excellent的互資訊來判斷這個詞的情感傾向這裡寫圖片描述 3、特徵提取時特徵項與類別的關聯程度

互資訊（Mutual Information）的介紹

概念

公式

解析公式

性質

缺點

應用

更多

互資訊（Mutual Information）的介紹

雙目立體匹配經典演算法之Semi-Global Matching（SGM）概述：匹配代價計算之互資訊（Mutual Information，MI）

Confluence 6 資料庫表-系統資訊（System information）

資訊熵、交叉熵與相對熵(KL散度)的關係，還介紹了聯合資訊熵和條件熵、互資訊（資訊增益）的概念

Python 資訊熵條件資訊熵互資訊（資訊增益）的理解以及計算程式碼

sugar與阿龍的互懟（第一季）

Hadoop的本地庫（Native Libraries）介紹

hdu 4135 a到b的範圍中多少數與n互質（容斥）

Confluence 6 數據庫表-系統信息（System information）

自動精簡配置（Thin Provision）介紹

Ansible之YAML，Inventory（主機清單）介紹

PHP規範PSR6（Cache介面）介紹

PHP規範PSR4（自動載入）介紹

PHP規範PSR3（日誌介面）介紹

PHP規範PSR2（編碼指南）介紹（三）

PHP規範PSR2（編碼指南）介紹（二）

PHP規範PSR2（編碼指南）介紹（一）

hadop 檢視DataNode的資源使用情況資訊（web介面）

BigDecimal 舍入模式（Rounding mode）介紹

LTE-A 載波聚合（Carrier Aggregation）介紹【轉】

互資訊（Mutual Information）的介紹

概念

公式

解析公式

性質

缺點

應用

更多

相關推薦