資訊理論小結

阿新 • • 發佈：2018-12-17

資訊理論小結

joey 周琦

某個事件x發生的概率為p(x),那麼該事件的資訊量 $h(x)=-\log P(x)$

該定義滿足h(x)>=0
若事件x,y相互獨立，那麼

$h(x,y)=-\log p(x,y)=-\log p(x)p(y) = h(x) + h(y)$

熵：可以表示某個隨機事件包含的資訊量的期望

熵= $-\sum_i p_i \log p_i$
條件熵： $H[y|x] = -\sum p(y,x)\log p(y|x)$
互資訊: $I(x,y)=H(x)-H(x|y)=H(y)-H(y|x)$
決策樹中的，information gain也就是互資訊，即假設有資料集D,某特徵A, $IG(D,A) = H(D) - H(D|A)$

KL散度（kl divergence）

若有一個未知分佈 $p(x)$ , 假設我們利用 $q(x)$ 來逼近該分佈，那麼 $q(x)$ 逼近 $p(x)$ 的程度可以用KL divergence表示
$KL(p||q)= - \int p(x)\log q(x) - (-\int p(x) \log p(x) ) = - \int p(x) \log \frac{q(x)}{p(x)}$
可以證明：KL散度不對稱，>=0
可以證明: $I(x,y) = KL(p(x,y)||p(x)p(y))$

資訊理論小結

資訊理論小結 joey 周琦某個事件x發生的概率為p(x),那麼該事件的資訊量 h(x)=−logP(x) h(x)=-\log P(x) 該定義滿足h(x)>=0 若事件x,y相互獨立，那麼

小結:VB.NET機房收費系統個人版

style 曾經 static 設計由於什麽圖書館 block 技術經過幾天的縫縫補補，自己的個人版最終OK了，！或許是由於有第一次的機房收費系統的經驗，這次做，感覺很親切。在業務邏輯方面，沿襲曾經的邏輯。做了一點升級。可是修改不大。

IntelliJ IDEA常用快捷鍵小結

導入 ... 調用 ins 函數隱藏文檔提示 alt+ IntelliJ Idea 常用快捷鍵列表 Ctrl+Alt+t 選擇代碼塊 try catch Alt+回車導入包,自動修正Ctrl+N 查找類Ctrl+Shift+N 查找文件Ctrl+Alt+L 格

有利於SEO的DIV+CSS的命名規則小結

程序員命名開發編織由於項目中編寫文檔結構、編寫CSS的人員較多，並與程序員協同工作，所以就需要統一開發規範，根據XHTMl和CSS編織的規範和大多人的習慣，整理了以下針對本項目的一個簡單的開發規範.一、CSS文件及樣式命名 1、CSS文件命名規範全局樣式：global.css；框架

python 時間模塊小結（time and datetime）

間隔 -i date對象 per inf ear macbook port 兩個一：經常使用的時間方法 1.得到當前時間使用time模塊，首先得到當前的時間戳 In [42]: time.time() Out[42]: 1408066927.208922 將時間戳轉換

Linux下磁盤空間不足的小結

linux 空間如何 1、i節點滿了如何解決：a）刪除無用的臨時文件，釋放inodeb）查看是不是0字節文件太多，因為0字節的文件也會占用inode2、磁盤真的是空間不夠了對於大磁盤來說，保留空間繼續保持默認（5%，留給root用戶維護系統或者記錄關鍵日誌的時候使用），對資源的確是一種浪費，可以

Vue工作原理小結

key 如何實現 reference 讀寫 owa 方法 cli scrip 枚舉本文能幫你做什麽？1、了解vue的雙向數據綁定原理以及核心代碼模塊2、緩解好奇心的同時了解如何實現雙向綁定為了便於說明原理與實現，本文相關代碼主要摘自vue源碼, 並進行了簡化改造，相對較

代碼上線流程以及版本發布小結

監測請求 log app 說明 process class 指定簡單之前的上線流程很簡單粗暴如圖：這簡直是災難性質的，上傳 SVN，在測試服務器上看看正在調試的接口沒問題，直接 sync 到線上服務器。代碼無法回滾，只能覆蓋。而客戶端的同學需要穩當的 api 作為

Fragment小結

star hello mov 查看 bundle 返回手機 fcm 程序 Fragment是Android3.0之後增加的新特性，通常人們叫它碎片。可是，我認為把它理解成一個View模塊比較好，盡管它不是繼承自View。假設閱讀過源代碼就知道它是內置View對象從而實

crontab計劃任務無法執行（小結）

crontab最近在與朋友梳理運維中遇到的坑的時候，發現大家都遇見過crontab計劃任務沒法正常執行的情況，如是簡單的整理下,主要有如下幾種情況：1、環境變量是否定義說明：crontab執行shell時，只能識別為數不多的環境變量，所有在腳本中最好使用export重新聲明下該變量說明：shell腳本rman

網絡流小結

n-1 uniq stdout 問題 %d 出現 mat 但是 comment 第一個問題: 費用流中。原圖無負環的前提上。為什麽增廣時的最短路算法不會陷入負環。即為什麽增廣後的殘圖不會出現負環？事實上這是一個非常淺顯的問題。但是我糾結了好長時間。233。首先如

bug排查小結

解決 roc ssl mysq show mysql 引擎 ces 排查 mysql cpu利用率偏高，並且長時間居高不下。 show processlist 發現有一個單表查詢的sql語句出現的頻率比較高，這個單表查詢中規中矩，where語句中條件都使用&r

15年錯題小結2月

規格基礎 c# 控制格式選項 oid 1.5 第一範式我將給大家解析一些題在一個Person類中已經定義好了一個代參的方法，直接實例化對象就賦值就好了所以在 a，b，c，d四個選項中 C 正確故選 C、 4. 應選d 這題選b正確編寫

LeetCode Binary Search Summary 二分搜索法小結

喜歡應用場景擴展 search pan 方式 env lan 第一個二分查找法作為一種常見的查找方法，將原本是線性時間提升到了對數時間範圍，大大縮短了搜索時間，具有很大的應用場景，而在LeetCode中，要運用二分搜索法來解的題目也有很多，但是實際上二分查找法的

Html中居中問題小結

center 圖片 middle 元素一:文字（行內元素）在塊盒子（塊元素）中水平居中:text-aligh:center;二:文字(行內元素)在塊盒子（塊元素）中垂直居中：設定行高等於盒子高例如: height:30px-------->line-height:30px;三：塊

T-Sql小結_02 關鍵字_02

創建數據庫 restrict length 多個寫到 ipc varchar pan 功能上次我們說到了sql裏面的增Create和Insert，那麽如果我們要刪除和修改要怎麽辦呢？首先我們要明確一件事情，那就是數據庫對象和數據的區別，這個其實在上一次裏面就該提到，因

Spring單例與線程安全小結

null 存在 sta 發的壓力 _for 處理方式好處 common 轉：http://www.cnblogs.com/doit8791/p/4093808.html 一、Spring單例模式與線程安全 Spring框架裏的bean，或者說組件，獲取實例的時候

PHP英文字母大小寫轉換函數小結

字符串 content 字符轉換 class 文字單詞 con 英文 code 每個單詞的首字母轉換為大寫：ucwords() 代碼如下: <?php$foo = ‘hello world!‘;$foo = ucwords($foo); /

2017年informix小結

性能分析 dba informix 資深 2017年informix小結，相關內容已經脫敏，需要腳本源碼，請和我聯系。# w01 - OS基本信息及負載情況IBM Informix Dynamic Server Version 11.50.FC9W3 -- On-Line -- Up 5

unity font研究小結

位圖 docs uil 設置 raw 分享 csdn llb android手機項目用ngui制作的界面。字體使用了unity默認的Arial，公布後在一些android手機上發現中文不顯示，就此作了一些調查。參考unity的font說明文檔：http

資訊理論小結

資訊理論小結

某個事件x發生的概率為p(x),那麼該事件的資訊量 h(x)=−logP(x) h(x)=-\log P(x)

熵：可以表示某個隨機事件包含的資訊量的期望

KL散度（kl divergence）

相關推薦

某個事件x發生的概率為p(x),那麼該事件的資訊量 $h(x)=-\log P(x)$