1. 程式人生 > >機器學習入門之《統計學習方法》筆記——樸素貝葉斯法

機器學習入門之《統計學習方法》筆記——樸素貝葉斯法

  樸素貝葉斯(naive Bayes)法是基於貝葉斯定理與特徵條件獨立假設的分類方法。

目錄

樸素貝葉斯法

  設輸入空間XRnn 維向量的集合,輸出空間為類標記集合Y={c1,c2,...,cK} ,輸入特徵向量xX ,輸出類標記為yYP(X,Y)XY 的聯合概率分佈,資料集

T={(x1,y1),(x2,y2),...,(xn,yn)}

P(X,Y) 獨立同分布產生。

  樸素貝葉斯法就是通過訓練集來學習聯合概率分佈

P(X,Y) .具體就是從先驗概率分佈和條件概率分佈入手,倆概率相乘即可得聯合概率。

  稱之為樸素是因為將條件概率的估計簡化了,對條件概率分佈作了條件獨立性假設,這也是樸素貝葉斯法的基石,假設如下

P(X=x|Y=ck)=P(X(1)=x(1),...,X(n)=x(n)|Y=ck)
k=1,2,...,K

  這個公式在之前的假設條件下等價於

j=inP(X(j)=x(j)|Y=ck)

  對於給定的輸入向量

x ,通過學習到的模型計算後驗概率分佈P(Y=Ck|X=x) ,後驗分佈中最大的類作為x 的輸出結果,根據貝葉斯定理可知後驗概率為

P(Y=ck|X=x)=P(X=x|Y=ck)P(Y=ck)kP(X=x|Y=ck)P(Y=ck)

  其中