樸素貝葉斯分類演算法原理
阿新 • • 發佈:2018-12-31
目錄
- 概述
- 原理
- 要點
1、概述
樸素貝葉斯分類演算法是貝葉斯分類演算法中最簡單的一種,貝葉斯分類演算法以樣本可能屬於某類的概率來作為分類依據。貝葉斯分類演算法是一大類分類演算法的總稱。
2、原理
如果一個事物在一些屬性條件發生的情況下,事物屬於A的概率大於屬於B的概率,則判定事物屬於A。
樸素貝葉斯分類器
樸素貝葉斯分類器的表示形式:
當特徵為為x時,計算所有類別的條件概率,選取條件概率最大的類別作為待分類的類別。由於上公式的分母對每個類別都是一樣的,因此計算時可以不考慮分母,即
樸素貝葉斯的樸素體現在其對各個條件的獨立性假設上,加上獨立假設後,大大減少了引數假設空間。
3、要點
- 分解各類先驗樣本資料中的特徵;
- 計算各類資料中,各特徵的條件概率,比如:特徵1出現的情況下,屬於A類的概率 p(A|特徵1),屬於B類的概率 p(B|特徵1),屬於C類的概率p(C|特徵1)......
- 分解待分類資料中的特徵(特徵1、特徵2、特徵3、特徵4......)
- 計算各特徵的各條件概率的乘積,如下所示:判斷為A類的概率:p(A|特徵1)*p(A|特徵2)*p(A|特徵3)*p(A|特徵4).....,判斷為B類的概率:p(B|特徵1)*p(B|特徵2)*p(B|特徵3)*p(B|特徵4).....,判斷為C類的概率:p(C|特徵1)*p(C|
- 結果中的最大值就是該樣本所屬的類別。