1. 程式人生 > >樸素貝葉斯法及其R實現

樸素貝葉斯法及其R實現

1. 樸素貝葉斯基本方法

1.1 貝葉斯分類法基本公式:

P(Y=ck|X=x)=P(Y=ck)ΠjP(X(j)=x(j)|Y=ck)k(P(Y=ck)ΠjP(Xj=xj|Y=ck)),k=1,2,,K
樸素貝葉斯分類器可以表示為
y=f(x)=argmaxckP(Y=ck)ΠjP(X(j)=x(j)|Y=ck)k(P(Y=ck)ΠjP(Xj=xj|Y=ck))
上式中,分母對所有的ck都相同,所以
y=argmaxckP(Y=ck)ΠjP(X(j)=x(j)|Y=ck)

1.2 後驗概率最大化含義

樸素貝葉斯法將例項分類到後驗概率最大的類中,這等價於期望風險最小化,選擇0-1損失函式:

L(Y,f(X))={1Yf(X)0Y=f(X)
f(X)為分類決策函式。
根據期望風險最小化準則得到後驗概率最大化準則:
f(x)=argmaxckP(ck|X=x)
此為樸素貝葉斯法所採用的的原理。

2. 樸素貝葉斯法的引數估計

2.1 極大似然估計

設第j個特徵x(j)可能取值的集合為{aj1,aj2,,ajs},條件概率P(x(j)=ajl|Y=ck)的極大似然估計為

P(X(j)=ajl|Y=ck)=Ni=1I(x(j)i=ajl,yi=ck)Ni=1I(yi=ck)j=1,2,,n;l=1,2,,Sj;k=1