1. 程式人生 > >樸素貝葉斯分類演算法原理

樸素貝葉斯分類演算法原理

目錄

  • 概述
  • 原理
  • 要點

1、概述

樸素貝葉斯分類演算法是貝葉斯分類演算法中最簡單的一種,貝葉斯分類演算法以樣本可能屬於某類的概率來作為分類依據。貝葉斯分類演算法是一大類分類演算法的總稱。

2、原理

如果一個事物在一些屬性條件發生的情況下,事物屬於A的概率大於屬於B的概率,則判定事物屬於A。

樸素貝葉斯分類器

  樸素貝葉斯分類器的表示形式:

  當特徵為為x時,計算所有類別的條件概率,選取條件概率最大的類別作為待分類的類別。由於上公式的分母對每個類別都是一樣的,因此計算時可以不考慮分母,即

  樸素貝葉斯的樸素體現在其對各個條件的獨立性假設上,加上獨立假設後,大大減少了引數假設空間。

3、要點

  • 分解各類先驗樣本資料中的特徵;
  • 計算各類資料中,各特徵的條件概率,比如:特徵1出現的情況下,屬於A類的概率 p(A|特徵1),屬於B類的概率 p(B|特徵1),屬於C類的概率p(C|特徵1)......
  • 分解待分類資料中的特徵(特徵1、特徵2、特徵3、特徵4......)
  • 計算各特徵的各條件概率的乘積,如下所示:判斷為A類的概率:p(A|特徵1)*p(A|特徵2)*p(A|特徵3)*p(A|特徵4).....,判斷為B類的概率:p(B|特徵1)*p(B|特徵2)*p(B|特徵3)*p(B|特徵4).....,判斷為C類的概率:p(C|特徵1)*p(C|
    特徵2)*p(C|特徵3)*p(C|特徵4).....
  • 結果中的最大值就是該樣本所屬的類別。