特徵選擇(1):特徵相關性度量之互資訊量(matlab程式碼實現)

阿新 • • 發佈：2018-11-06

互資訊的概念

互資訊量定義基於資訊熵的概念。在資訊理論中，資訊熵可度量變數的不確定性。設在隨機空間中，某一離散變數X 的概率分佈為p(x)，則X 的資訊熵定義為：

其中，log 以2 為底。若兩個離散隨機變數X 和Y 的聯合概率分佈為p(x, y)，則X 和Y 的條件資訊熵為：

X 和Y 的互資訊量I(X; Y)的定義如下：

互資訊與特徵選擇

互資訊主要是一個特徵選擇相關性的度量單位，設X為資料，Y為標籤，互資訊則表示資料與標籤的相關性。一般大小為[0,inf).越高則表示這個特徵越重要，簡單的特徵選擇如FR，就是根據相關性來排序，選擇最高的幾個。

除了資料與類標之間的相關性，還有資料之間的冗餘性。如果資料之間相關性越高，則冗餘性越強，如mRMR特徵選擇，則是根據最大類標相關性最小資料冗餘性的準則來進行特徵選擇。

程式碼

該程式碼主要參考於https://blog.csdn.net/xyisv/article/details/81504764，博主Reacubeth。並最其進行了修改和註釋，刪除了一些不必要的內容。

下面的程式碼主要用於資料列標籤和類標的互資訊計算。類標為2類資料。

function mi=Mutual_information(X,Y)
num=size(X,1);%例項數量
label=unique(Y);
Z=[X,Y];%所有例項的維度值及標籤
if(num/10>20)
    nbins=20;
else
    nbins=max(floor(num/10),10);%設定區間的個數
end;
PX=hist(X,nbins);%min(X)到max(X)劃分出nbins個區間出來，求每個區間的概率
PX=PX./num;%除以例項數量
i=find(PX==0);
PX(i)=0.00001;%不能使某一區間的概率為0
od=size(Y,2);%標籤的列數，一般為1，多列Y暫時不考慮
cl=od;
if length(unique(Y))==2 %二類分類問題 label(1)
    if(od==1)
        PY=[length(find(Y==label(1))) length(find(Y==(label(2))))]/num;
        cl=2;
    else%多列Y 暫時不考慮
    end
    p=zeros(cl,nbins);
    rx=abs(max(X)-min(X))/nbins;%每個區間長度
    for i=1:cl
        xl=min(X);%變數的下界
        for j=1:nbins
            if(i==2)&&(od==1)
                interval=(xl<=Z(:,1))&(Z(:,2)==label(2));
            else
                interval=(xl<=Z(:,1))&(Z(:,i+1)==label(1));
            end;
            if(j<nbins)
                interval=interval&(Z(:,1)<xl+rx);
            end;
            p(i,j)=length(find(interval));
            if p(i,j)==0;
                p(i,j)=0.00001;
            end
            xl=xl+rx;
        end;
    end;   
end
HA=-sum(PX.*log(PX));%計算當前維度的資訊熵
HY=-sum(PY.*log(PY));%計算標籤的資訊熵
PX=repmat(PX,cl,1);
PY = repmat(PY',1,nbins);
p=p./num;
mi=sum(sum(p.*log(p./(PX.*PY))));
%info = 2 * mi ./ (HA + HY);%計算互資訊
            
        
end

後記

暫時只是列向量資料與標籤向量的計算，隨後會陸續用於列向量資料之間的計算，多類資料，聚類資料。

資料來源：https://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/binary.html

特徵選擇(1):特徵相關性度量之互資訊量(matlab程式碼實現)

互資訊的概念互資訊量定義基於資訊熵的概念。在資訊理論中，資訊熵可度量變數的不確定性。設在隨機空間中，某一離散變數X 的概率分佈為p(x)，則X 的資訊熵定義為：

影象處理之直方圖均衡MATLAB程式碼實現

MATLAB畫灰度影象直方圖的程式碼 I=imread('cameraman.tif'); [M N]=size(I);%求出圖片大小 y=zeros(1,256) x=0:255; for t=0:255 for i=1:M for j=1:N

特徵選擇(2):mRMR特徵選擇演算法(matlab程式碼實現)

mRMR是什麼是基於最大相關最小冗餘的特徵選擇方法。要點：1.相關是特徵列與類標的相關性，也可以值特徵之間的相關性，通常來說，特徵與類標相關性越高，說明這個特徵越重要。則選擇這個特徵，這就是最大相關。 2.最小冗餘：特徵選擇的目的就是減少分類器的負擔，減少不需要的特徵。而兩個特徵之間

特徵選擇與特徵理解（sklearn）

特徵選擇(排序)對於資料科學家、機器學習從業者來說非常重要。好的特徵選擇能夠提升模型的效能，更能幫助我們理解資料的特點、底層結構，這對進一步改善模型、演算法都有著重要作用。特徵選擇主要有兩個功能：減少特徵數量、降維，使模型泛化能力更強，減少過擬合增強對特徵和特

秋招總結問題一：為什麼需要特徵選擇？特徵選擇有哪些？

1.為什麼需要特徵選擇？特徵選擇有哪些？第一個問題：①在現實任務中經常會遇到維數災難問題，屬性過多造成的。 ②可以降低學習任務的難度。不相關的特徵就是噪聲。第二個問題：過濾式，包裹式，嵌入式特徵選擇分為兩個部分，一個是子集搜尋，一個是子集評價。子集搜尋有

第3章特徵選擇與特徵工程

標籤編碼，字典向量化，特徵雜湊 LabelEncoder和OneHotEncoder 在特徵工程中的應用對於性別，sex，一般的屬性值是male和female。兩個值。那麼不靠譜的方法直接用0表示male，用1表示female 了。所以要用one-hot編碼。 array([[0.

特徵選擇與特徵降維的差別

在machine learning中，特徵降維和特徵選擇是兩個常見的概念，在應用machine learning來解決問題的論文中經常會出現。對於這兩個概念，很多初學者可能不是很清楚他們的區別。很多人都以為特徵降維和特徵選擇的目的都是使資料的維數降

特徵選擇和特徵變換

一般情況下，特徵是相關的。例如，影象中，我們利用每個畫素紅、綠、藍三個通道進行影象分類（例如影象中貓狗的判別）。感知紅光的感測器也會捕獲一些藍光和綠光。類似的，藍光和綠光的感測器也會接收一定程度的紅光。結果，畫素的R、G、B三通道的值就是統計相關的。這樣，簡單從特徵向量中拋棄R值，便也將

特徵選擇和特徵提取區別、PCA VS LDA

1.特徵提取 V.S 特徵選擇特徵提取和特徵選擇是DimensionalityReduction（降維）的兩種方法，針對於the curse of dimensionality(維災難)，都可以達到降維的目的。但是這兩個有所不同。特徵提取（Feature

特徵選擇與特徵抽取的區別

機器學習領域的一個普遍問題是如何降低資料的維度，因為過高的維度會嚴重影響計算效率並造成資料稀疏。降維方法一般分為兩類：特徵選擇（Feature Selection）和特徵抽取（Feature Extraction）。特徵選擇特徵選擇的目標是從原始的d個特徵中選擇k個特徵。特徵抽取特徵抽取的目標

降維：特徵選擇與特徵提取

對於降維，我看可以簡單理解為減少資料的維度，說白了就是減少變數個數。文末的視訊牆裂推薦觀看一下。特徵選擇：不改變變數的含義，僅僅只是做出篩選，留下對目標影響較大的變數。 Backward Elimination（反向淘汰） Forward Selectio

ML之LS&OLS：LS&OLS演算法的簡介、論文、演算法的改進(最佳子集選擇法、前向逐步迴歸法)、程式碼實現等詳細攻略

ML之LS&OLS：LS&OLS演算法的簡介、論文、演算法的改進(最佳子集選擇法、前向逐步迴歸法)、程式碼實現等詳細攻略 LS&OLS演算法的簡介 OLS是在大約200 年前(1806年)由高斯（Gauss）和法國數學家阿德里安-

安卓使用記錄筆記（1）ndk使用之Java呼叫c++程式碼

1.在Java中新建一個Utils類 1）指定路徑下新建一個資料夾，包名為Utils 2）新建類 NativeUtils.java package com.sample.Utils; publi

Algorithm之PrA：PrA之IP整數規劃(包括0-1整數規劃)演算法經典案例剖析+Matlab程式設計實現

Algorithm之PrA：PrA之IP整數規劃演算法經典案例剖析+Matlab程式設計實現分枝定界法對有約束條件的最優化問題（其可行解為有限數）的所有可行解空間恰當地進行系統搜尋，這就是分枝與定界內容。通常，把全部可行解空間反覆地分割為越來越小的子集，稱

自學演算法之互質數和質數程式碼實現

互質數定義：最大公約數只有1的兩個整數，叫做互質數。例如： 7,11,13的最大公約數為1，即三者互質。程式碼實現：輾轉相除法(兩數的最大公約數求法) 用較小的數(Big)除以較大的數，

機器學習之AdaBoost原理與程式碼實現

1 2.000000 1.000000 38.500000 66.000000 28.000000 3.000000 3.000000 0.000000 2.000000 5.000000 4.000000 4.000000 0.0

機器學習之KNN原理與程式碼實現

KNN原理與程式碼實現 KNN原理 KNN（k-Nearest Neighbour）：K-近鄰演算法，主要思想可以歸結為一個成語：物以類聚工作原理給定一個訓練資料集，對新的輸入例項，在訓練資料集中找到與該例項最鄰近的 k （k

安卓專案實戰之ByeBurger一句程式碼實現標題欄、導航欄滑動隱藏

簡介效果圖內容View可為：ViewPager中巢狀RecycleView 內容View可為：NestedScrollView包裹TextView 內容View可為：NestedScrollView包裹WebView 如何使用 1.在project的

深度學習之目標檢測object_detection程式碼實現

基於tensorflow的object_detection框架和slim框架，實現一個目標檢測系統：一：資料及準備 1.資料標註，使用labelImg對資料集進行標註，生成對應的xml檔案 2.使用create_pet_tf_record.py指令碼生成tfrec

特徵選擇(1):特徵相關性度量之互資訊量(matlab程式碼實現)

互資訊的概念

互資訊與特徵選擇

程式碼

後記

相關推薦