1. 程式人生 > >結構信息論-學習

結構信息論-學習

center 物理 功能 推廣 容易 之間 pan 信息 高效

結構信息論—結構信息度量

------------李昂生教授

網絡空間大數據信息處理的高效算法要求滿足高精度和快速兩個主要指標。快速容易理解,高精度一直是一個難題,原因在於我們常常不知道要優化的目標是什麽。現實世界的大數據空間是客觀世界生成的對象(對象是有結構的,往往可以看成一個圖),是有規律的,也有噪音和隨機性,我們知道規律嵌在大規模噪音結構中,但是不知道標準答案是什麽。事實上,信息處理的根本任務就是從大規模噪音結構中解碼出嵌入其中(物理系統)的規律。解決網絡空間大數據高精度問題需要有一個新的信息論,它能度量嵌入在復雜系統中的信息,這個信息量能區分網絡空間大數據的規律與噪音,從而解碼出嵌入在大規模噪音結構中的規律

。這就是本文介紹的新理論——結構信息論

計算機的根本任務是信息處理,一直以來,信息處理的理論基礎都是Shannon信息論。Shannon信息論以及概率、統計學為很多數據分析與信息處理提供了理論基礎。然而,隨著新型大數據的出現,這些數據之間有著復雜的關系,數據的知識與規律嵌入在大規模的噪音結構中。對這些大數據的編碼、壓縮、解碼、知識提取、數據結構分析要求我們能度量嵌入在復雜系統中的信息這種信息決定並解碼出該復雜系統的實質結構這種實質結構支撐著復雜系統的功能語義。大數據時代的這一新使命使得度量結構信息更加凸顯為一個基本科學問題。

長期以來,學術界沒有一個定義,也沒有一個度量來確定系統的信息

。實際中的做法是,根據系統結構提取一個概率分布,利用概率分布的信息來度量系統的信息。直到最近,筆者和潘祎誠第一次提出了一個結構信息的度量,它可以度量嵌入在一個圖中的高維信息(或深度信息),並且在度量結構信息的同時解碼出原系統的實質結構,以支撐系統的語義分析結構信息是定義在圖上的,然而,同樣的度量也可以對概率分布來定義,這時,可以證明,對任意的編碼樹,該分布在編碼樹下的結構熵退化為分布的Shannon熵。因此結構熵是Shannon熵的自然推廣,從無結構的概率分布擴充到任意結構的圖上。...............................

結構信息論-學習