1. 程式人生 > >樸素貝葉斯及其數學推導

樸素貝葉斯及其數學推導

一、樸素貝葉斯簡單介紹

樸素貝葉斯成立的前提是條件獨立性假設:分類的特徵xi在類別確定的條件下都是獨立的,用公式表示如下:

P(X=xi|Y=ck)=P(X=x1i,X=x2i,,X=xni|Y=ck)=j=1nP(X(j)=xji|Y=ck)
其中ck是類別,假設有K個類,n是樣本的維度,xi是輸入樣本

樸素貝葉斯法表示如下:

y=argmaxckP(Y=ck)j=1nP(X(j)=xji|Y=ck)

二、貝葉斯決策論

介紹樸素貝葉斯中最大化後驗概率的來源
樸素貝葉斯選擇0-1損失函式作為評價標準,0-1損失函式表示如下:

L(Y,f(X))={
0,1,Y = f(X) f(X)

其中f(X)是分類決策函式
期望損失:Rexp(f)=E(L(Y,f(x))),顯然對每個樣本x最小化條件風險,則期望損失最小,下面證明期望損失最小化等價於後驗概率最大化:
f(x)=argminyYi=1KL(ck,y)P(y=ck|X=x)=argminyYi=1KP(yck|X=x)=argminyYi=1K(1P(y=ck|X=x))=argmaxyYi=1KP(y=ck|X=x)
得到後驗概率最大化準則:
f(x)==argmaxyYi=1KP(y=ck|X=x)
其中Y={c1,c2,,cK},K是類別個數

三、引數估計

方法1:極大似然估計

下面先給出結果,再證明
先驗概率估計:

P(Y=ck)=<