MATLAB實現正態分佈ML（極大似然）估計

阿新 • • 發佈：2019-01-05

下面用MATLAB實現正態分佈的ML估計

% 二維正態分佈的兩分類問題  （ML估計）

clc;
clear;

% 兩個類別資料的均值向量
Mu = [0 0; 3 3]';
% 協方差矩陣
S1 = 0.8 * eye(2);
S(:, :, 1) = S1;
S(:, :, 2) = S1;
% 先驗概率（類別分佈）
P = [1/3 2/3]';
% 樣本資料規模
% 收斂性：無偏或者漸進無偏，當樣本數目增加時，收斂性質會更好
N = 500;


% 1.生成訓練和測試資料
%{
    生成訓練樣本
    N = 500,  c = 2, d = 2
    μ1=[0, 0]'   μ2=[3, 3]'
    S1=S2=[0.8, 0; 0.8, 0]
    p(w1)=1/3   p(w2)=2/3
%}
randn('seed', 0);
[X_train, Y_train] = generate_gauss_classes(Mu, S, P, N);

figure();
hold on;
class1_data = X_train(:, Y_train==1);
class2_data = X_train(:, Y_train==2);
plot(class1_data(1, :), class1_data(2, :), 'r.');
plot(class2_data(1, :), class2_data(2, :), 'g.');
grid on;
title('訓練樣本');
xlabel('N=500');

%{
    用同樣的方法生成測試樣本
    N = 500,  c = 2, d = 2
    μ1=[0, 0]'   μ2=[3, 3]'
    S1=S2=[0.8, 0; 0.8, 0]
    p(w1)=1/3   p(w2)=2/3
%}
randn('seed', 100);
[X_test, Y_test] = generate_gauss_classes(Mu, S, P, N);
figure();
hold on;
test1_data = X_test(:, Y_test==1);
test2_data = X_test(:, Y_test==2);
plot(test1_data(1, :), test1_data(2, :), 'r.');
plot(test2_data(1, :), test2_data(2, :), 'g.');
grid on;
title('測試樣本');
xlabel('N=500');


% 2.用訓練樣本採用ML方法估計引數
% 各類樣本只包含本類分佈的資訊，也就是說不同類別的引數在函式上是獨立的
[mu1_hat, s1_hat] = gaussian_ML_estimate(class1_data);
[mu2_hat, s2_hat] = gaussian_ML_estimate(class2_data);
mu_hat = [mu1_hat, mu2_hat];
s_hat = (1/2) * (s1_hat + s2_hat);


% 3.用測試樣本和估計出的引數進行分類
% 使用歐式距離進行分類
z_euclidean = euclidean_classifier(mu_hat, X_test);
% 使用貝葉斯方法進行分類
z_bayesian = bayes_classifier(Mu, S, P, X_test);


% 4.計算不同方法分類的誤差
err_euclidean = ( 1-length(find(Y_test == z_euclidean')) /  length(Y_test) );
err_bayesian = ( 1-length(find(Y_test == z_bayesian')) /  length(Y_test) );
% 輸出資訊
disp(['基於歐式距離分類的誤分率：', num2str(err_euclidean)]);
disp(['基於最小錯誤率貝葉斯分類的誤分率：', num2str(err_bayesian)]);


% 畫圖展示
figure();
hold on;
z_euclidean = transpose(z_euclidean);
o = 1;
q = 1;
for i = 1:size(X_test, 2)
    if Y_test(i) ~= z_euclidean(i)
        plot(X_test(1,i), X_test(2,i), 'bo');
    elseif z_euclidean(i)==1
        euclidean_classifier_results1(:, o) = X_test(:, i);
        o = o+1;
    elseif z_euclidean(i)==2
        euclidean_classifier_results2(:, q) = X_test(:, i);
        q = q+1;
    end
end
plot(euclidean_classifier_results1(1, :), euclidean_classifier_results1(2, :), 'r.');
plot(euclidean_classifier_results2(1, :), euclidean_classifier_results2(2, :), 'g.');
title(['基於歐式距離分類，誤分率為：', num2str(err_euclidean)]);
grid on;

figure();
hold on;
z_bayesian = transpose(z_bayesian);
o = 1;
q = 1;
for i = 1:size(X_test, 2)
    if Y_test(i) ~= z_bayesian(i)
        plot(X_test(1,i), X_test(2,i), 'bo');
    elseif z_bayesian(i)==1
        bayesian_classifier_results1(:, o) = X_test(:, i);
        o = o+1;
    elseif z_bayesian(i)==2
        bayesian_classifier_results2(:, q) = X_test(:, i);
        q = q+1;
    end
end
plot(bayesian_classifier_results1(1, :), bayesian_classifier_results1(2, :), 'r.');
plot(bayesian_classifier_results2(1, :), bayesian_classifier_results2(2, :), 'g.');
title(['基於最小錯誤率的貝葉斯決策分類，誤分率為：', num2str(err_bayesian)]);
grid on;

生成資料的函式：

function [ data, C ] = generate_gauss_classes( M, S, P, N )
%{
    函式功能：
        生成樣本資料，符合正態分佈

    引數說明：
        M：資料的均值向量
        S：資料的協方差矩陣
        P：各類樣本的先驗概率，即類別分佈
        N：樣本規模

    函式返回
        data：樣本資料（2*N維矩陣）
        C：樣本資料的類別資訊
%}

[~, c] = size(M);
data = [];
C = [];

for j = 1:c
    % z = mvnrnd(mu,sigma,n);
    % 產生多維正態隨機數，mu為期望向量，sigma為協方差矩陣，n為規模。
    % fix 函式向零方向取整
    t = mvnrnd(M(:,j), S(:,:,j), fix(P(j)*N))';
    
    data = [data t];
    C = [C ones(1, fix(P(j) * N)) * j];
end

end

正態分佈的ML估計（對訓練樣本）：

function [ m_hat, s_hat ] = gaussian_ML_estimate( X )
%{
    函式功能：
        樣本正態分佈的最大似然估計

    引數說明：
        X：訓練樣本

    函式返回：
        m_hat：樣本由極大似然估計得出的正態分佈引數，均值
        s_hat：樣本由極大似然估計得出的正態分佈引數，方差
%}

% 樣本規模
[~, N] = size(X);
% 正態分佈樣本總體的未知均值μ的極大似然估計就是訓練樣本的算術平均
m_hat = (1/N) * sum(transpose(X))';

% 正態分佈中的協方差陣Σ的最大似然估計量等於N個矩陣的算術平均值
s_hat = zeros(1);
for k = 1:N
    s_hat = s_hat + (X(:, k)-m_hat) * (X(:, k)-m_hat)';
end
s_hat = (1/N)*s_hat;
end

% 詳細的計算過程推導可以參考前一篇部落格：極大似然估計詳解。

有了估計引數，對測試資料進行分類：

基於歐式距離的分類：

function [ z ] = euclidean_classifier( m, X )
%{
    函式功能：
        利用歐式距離對測試資料進行分類

    引數說明：
        m：資料的均值，由ML對訓練資料，引數估計得到
        X：我們需要測試的資料

    函式返回：
        z：資料所屬的分類
%}

[~, c] = size(m);
[~, n] = size(X);

z = zeros(n, 1);
de = zeros(c, 1);
for i = 1:n
    for j = 1:c
        de(j) = sqrt( (X(:,i)-m(:,j))' * (X(:,i)-m(:,j)) );
    end
    [~, z(i)] = min(de);
end

end

基於最小錯誤率的貝葉斯估計：

function [ z ] = bayes_classifier( m, S, P, X )
%{
    函式功能：
        利用基於最小錯誤率的貝葉斯對測試資料進行分類

    引數說明：
        m：資料的均值
        S：資料的協方差
        P：資料類別分佈概率
        X：我們需要測試的資料

    函式返回：
        z：資料所屬的分類
%}

[~, c] = size(m);
[~, n] = size(X);

z = zeros(n, 1);
t = zeros(c, 1);
for i = 1:n
    for j = 1:c
        t(j) = P(j) * comp_gauss_dens_val( m(:,j), S(:,:,j), X(:,i) );
    end
    [~, z(i)] = max(t);
end

end

function [ z ] = comp_gauss_dens_val( m, s, x )
%{
    函式功能：
        計算高斯分佈N（m, s），在某一個特定點的值

    引數說明：
        m：資料的均值
        s：資料的協方差
        x：我們需要計算的資料點

    函式返回：
        z：高斯分佈在x出的值
%}

z = ( 1/( (2*pi)^(1/2)*det(s)^0.5 ) ) * exp( -0.5*(x-m)'*inv(s)*(x-m) );

end

MATLAB實現正態分佈ML（極大似然）估計

下面用MATLAB實現正態分佈的ML估計 % 二維正態分佈的兩分類問題（ML估計） clc; clear; % 兩個類別資料的均值向量 Mu = [0 0; 3 3]'; % 協方差矩陣 S1 = 0.8 * eye(2); S(:, :, 1) = S1;

正態分佈的最大似然估計

給定資料集D={x1, x2, ... , xn}，假設都服從均值為mean（假設未知），方差為var的高斯分佈（假設已知），則引數θ為均值mean. p(D|θ) = ∏p(xi|θ) =p(x1|

MATLAB繪製正態分佈概率密度函式(normpdf)圖形

這裡是一個簡單的實現程式碼 x=linspace（-5,5,50); %生成負五到五之間的五十個數，行向量 y=normpdf(x,0,1); plot(x,y,‘k’); 圖片複製不過來。。就擺個連結好了 https://jingyan.baidu.com/article/6fb756ec

一個監督學習（極大似然分類）與非監督學習（K-means）的例子（matlab實現）

上遙感原理與應用的時候，老師給我們大致講了一下遙感影象的地物分類問題，大致瞭解了一下機器學習方法在遙感影像處理方面的應用問題。下面將所做作業進行一個大致的總結：資料訓練集一共四種：building、road、vegetation、water，分別

標準正態分佈表（scipy.stats）

0. 標準正態分佈表與常用值 Z-score 是非標準正態分佈標準化後的 x即 z=x−μσz = \frac{x-\mu}{\sigma}z=σx−μ 表頭的橫向表示小數點後第二位，表頭的

產生服從正態分佈隨機數（轉載）

一、為什麼需要服從正態分佈的隨機函式一般我們經常使用的隨機數函式 Math.random() 產生的是服從均勻分佈的隨機數，能夠模擬等概率出現的情況，例如扔一個骰子，1到6點的概率應該相等，但現實生活中更多的隨機現象是符合正態分佈的，例如20歲成年人的體重分佈等。

如何用matlab畫正態分佈曲線

MATLAB裡有直接的函式。呼叫語法如下：（正態分佈又被稱為高斯分佈） y = gaussmf(x,[sig c]) 其中x是變數，sig就是你圖片裡的σ，而c就是你圖片裡的μ，比如：下面是一個例子，你可以直接複製到MATLAB中執行就可以得到一個方差為2，均

MATLAB解決正態分佈資料的大致方法

當我們有了一個矩陣，如何判斷矩陣裡面的元素是否滿足正態分佈，以及如何繪製圖像和求引數。我根據自己最近使用matlab的一些體會，將大致方法寫下。 1、矩陣元素轉化成行向量 reshape()函式 ex

matlab實現簡單BP神經網路（不使用工具箱），兩種求誤差方式

BP網路實現y=1+x+x*x函式模擬，輸入層一個節點，隱含層8個節點，輸出層1個節點將資料分為測試集合和訓練集合兩部分 %% BP演算法模擬 y = 1 + x + x*x %作者：msl 時間：2017-10-07 clc; clear; %% step0:定義 Tr

最大似然估計演算法（極大似然估計演算法）

寫的很通俗易懂……. 最大似然估計提供了一種給定觀察資料來評估模型引數的方法，即：“模型已定，引數未知”。簡單而言，假設我們要統計全國人口的身高，首先假設這個身高服從服從正態分佈，但是該分佈的均值與方差未知。我們沒有人力與物力去統計全國每個人的身高，但是可以通

MATLAB實現由均勻分佈產生正態分佈和銳利分佈

xaxis=-10:0.1:10; miu=0; delta=1; N=1000000; u1=rand(1,N); u2=rand(1,N); y1=(-2*log(u1)).^0.5; y2=

正態分佈及matlab實現

正態分佈（Normal distribution）又名高斯分佈（Gaussian distribution），是一個在數學、物理及工程等領域都非常重要的概率分佈，在統計學的許多方面有著重大的影響力。若隨機變數X服從一個數學期望為μ、標準方差為σ2的高斯分佈，記為：

【ML學習筆記】17：多元正態分佈下極大似然估計最小錯誤率貝葉斯決策

簡述多元正態分佈下的最小錯誤率貝葉斯如果特徵的值向量服從d元正態分佈，即其概率密度函式為：即其分佈可以由均值向量和對稱的協方差矩陣唯一確定。如果認為樣本的特徵向量在類內服從多元正態分佈：即對於每個類i，具有各自的類內的均值向量和協

一維正態分佈、二維正態分佈的matlab實現

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %本程式用於產生一維正態分佈、二維正態分佈 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %繪製一維正態分佈 x=linspace(-3,3); y

正態分佈，銳利分佈，萊斯分佈 matlab擬合原始碼

如果你得到一堆數，你想知道它們的大致分佈，該怎麼辦呢？kedensity命令可以幫助你解決這個問題。命令如下： [f,xi]=ksdensity(x) plot(xi,f) 其中，f是估計的密度值，而xi是一個輔助引數，用來決定畫出圖形的取值區間，簡言之，xi大致涵蓋了x的取值區間。

正態分佈（normal distribution）與偏態分佈（skewed distribution）

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

R語言實戰--隨機產生服從不同分佈函式的資料（正態分佈，泊松分佈等），並將資料寫入資料框儲存到硬碟

隨機產生服從不同分佈的資料均勻分佈——runif（） > x1=round(runif(100,min=80,max=100)) > x1 [1] 93 100 98 98 92 98 98 89 90 98 100 89

20.方差/標準差/數學期望/正態分佈/高斯函式（數學篇）--- OpenCV從零開始到影象（人臉 + 物體）識別系列

本文作者：小嗷微信公眾號：aoxiaoji 吹比QQ群：736854977 本文你會找到以下問題的答案: 方差標準差數學期望正態分佈高斯函式 2.1 方差方差描述隨機變數對於數學期望的偏離程度。（隨機變數可以

C#產生正態分佈、泊松分佈、指數分佈、負指數分佈隨機數（原創）

http://blog.sina.com.cn/s/blog_76c31b8e0100qskf.html 在程式設計過程中，由於資料模擬模擬的需要，我們經常需要產生一些隨機數，在C#中，產生一般隨機數用Random即可，但是，若要產生服從特定分佈的隨機數，就需要一定的演

C++生成隨機數：高斯/正態分佈（gaussian/normal distribution）

常用的成熟的生成高斯分佈隨機數序列的方法由Marsaglia和Bray在1964年提出，C++版本如下： #include <stdlib.h> #include <math.h> double gaussrand() { static double V1, V2, S

MATLAB實現正態分佈ML（極大似然）估計

相關推薦