1. 程式人生 > >機器學習知識點查漏補缺(樸素貝葉斯分類)

機器學習知識點查漏補缺(樸素貝葉斯分類)

平滑 http 運算 貝葉斯公式 -s 目標 bubuko 思想 指數

一、基本模型

樸素貝葉斯分類模型的基本思想就是貝葉斯公式,對以特征為條件的各類別的後驗概率。

貝葉斯公式如下:

技術分享圖片

對標樸素貝葉斯分類模型的公式如下:

技術分享圖片

分子中的第二項為每個類別的概率(實際運算即頻率),如下:

技術分享圖片

第一項為每個類別內部(即以類別為條件)特征的聯合概率,如下:

技術分享圖片

但隨著特征的每個維度取值增加,模型參數也會指數級增加。所以樸素貝葉斯的樸素也就在這兒體現,樸素的(簡單的)假設以上每個特征維度都是條件獨立的,而讓其聯合概率可化簡為每個特征的條件概率積,如下:

技術分享圖片

樸素貝葉斯分類模型也即是最大化後驗概率的類別

技術分享圖片

而分母對每個類別都是相同的

技術分享圖片

二、優化目標函數

樸素貝葉斯的參數也即是各類別的先驗概率及各類別為條件的特征條件概率,其極大似然估計分別為:

技術分享圖片

技術分享圖片

為防止條件概率估計值為0的情況,會在其估計過程中加入拉普拉斯平滑處理

技術分享圖片

常取delta為1.

機器學習知識點查漏補缺(樸素貝葉斯分類)