AI機器學習-信息熵，條件熵，信息增益

阿新 • • 發佈：2018-04-20

人工智能其他

信息熵

信息熵是系統有序化程度的一個度量。比如說，我們要搞清楚一件非常非常不確定的事，或是我們一無所知的事情，就需要了解大量的信息。相反，如果我們對某件事已經有了較多的了解，我們不需要太多的信息就能把它搞清楚。

所以，從這個角度，我們可以認為，信息量的度量就等於不確定性的多少。一個系統越是有序，信息熵就越低；反之，一個系統越是混亂，信息熵就越高。1948 年，香農提出了“信息熵”(shāng) 的概念，所以信息熵也叫香農熵,假設在一個集合D中第i類樣本所占的比例為pi（i=1,2,3…n），則D的信息熵可表示為：

技術分享圖片

條件熵

現在我們假設將訓練數據D按屬性A進行劃分，假設屬性A有v個可能的取值，則按A屬性進行分裂出的v個子集（即樹中的v個分支），每個可能取值集合為D_j

_，則A屬性的條件熵計算方法為（|D_j|和|D|表示集合中元素的個數）：

技術分享圖片

信息增益

信息熵減去條件熵，表示此條件對於信息熵減少的程度，即可以對信息的判斷減少多少不確定性，數值越大，表示某個條件熵對信息熵減少程序越大，也就是說，這個屬性對於信息的判斷起到的作用越大。屬性A的信息增益的計算公式為：

技術分享圖片

關註微信公眾號“挨踢學霸”，獲取更多精彩文章

技術分享圖片

AI機器學習-信息熵，條件熵，信息增益

人工智能其他信息熵信息熵是系統有序化程度的一個度量。比如說，我們要搞清楚一件非常非常不確定的事，或是我們一無所知的事情，就需要了解大量的信息。相反，如果我們對某件事已經有了較多的了解，我們不需要太多的信息就能把它搞清楚。所以，從這個角度，我們可以認為，信息量的度量就等於不確定性的多少。一個系統越是

AI機器學習-信息熵，條件熵，信息增益

AI機器學習-信息熵，條件熵，信息增益

機器學習：資訊熵，基尼係數，條件熵，條件基尼係數，資訊增益，資訊增益比，基尼增益，決策樹程式碼實現（一）

如何在未來的大資料和AI機器學習領域，獲得一份不錯的工作？

機器學習之資訊增益（熵和條件熵）

機器學習完整過程案例分布解析，python代碼解析

機器學習PAI為你自動寫歌詞，媽媽再也不用擔心我的freestyle了（提供數據、代碼）

oracle學習之基本查詢和條件過濾，分組函數使用

Scala學習筆記一之基礎語法，條件控制，循環控制，函數，數組，集合

AI機器學習-決策樹算法-概念和學習過程

用是否買房為例來說明決策樹算法的使用-AI機器學習

機器學習基礎（六）—— 交叉熵代價函式（cross-entropy error）

機器學習筆記第4課：偏差，方差和權衡

資訊理論複習筆記（1）：資訊熵、條件熵，聯合熵，互資訊、交叉熵，相對熵

機器學習：貝葉斯分類器，樸素貝葉斯，拉普拉斯平滑

機器學習經典損失函式之交叉熵和均方差

機器學習筆記（二）矩估計，極大似然估計

機器學習(四)變數選擇技術----------嶺迴歸，Lasso

吳恩達機器學習課程：完全用Python完成，可以的！（附程式碼）

【機器學習調查】髒資料最棘手，邏輯迴歸最常用

機器學習--K-means演算法（聚類，無監督學習）

AI機器學習-信息熵，條件熵，信息增益

相關推薦