周志華 《機器學習》之 第七章(貝葉斯分類器)概念總結
阿新 • • 發佈:2019-01-09
貝葉斯分類器是利用概率的知識完成資料的分類任務,在機器學習中使用貝葉斯決策論實施決策的基本方法也是在概率的框架下進行的,它是考慮如何基於這些概率和誤判損失來選擇最優的類別標記。
1、貝葉斯決策論
機器學習的過程就是要尋找一個判定準則:
生成式模型 如:貝葉斯分類器
判別式模型 如:決策樹、BP神經網路、支援向量機
2、極大擬然估計
概率模型的訓練過程就是引數估計過程,
本文中採用極大擬然估計就是試圖在所有的可能的取值中,找到一個能使資料出現的“可能性”的最大值。
3、樸素貝葉斯分類器
樸素貝葉斯分類器 基於貝葉斯公式來估計後驗概率
4、半樸素貝葉斯分類器
為了降低貝葉斯公式中估計後驗概率的困難,提出使用樸素貝葉斯分類器採用屬性條件獨立性假設,然而在現實任務中這個假設很難成立,因此就提出半樸素貝葉斯分類器,它的基本思想是適當考慮一部分屬性間的相互依賴資訊,從而既不需要完全聯合概率計算,又不至於徹底忽略了比較強的屬性依賴關係。
5、貝葉斯網
貝葉斯網是藉助有向無環圖(DAG)來刻畫屬性之間的依賴關係,並使用條件概率表(CPT)來描述屬性的聯合概率分佈
結構
學習
推斷
6、EM演算法
如果訓練樣本的屬性“不完整”,因此在這種存在“未觀測”變數(隱變數)的情形下,如何進行模型引數估計呢?EM演算法就是常用的估計引數隱變數的利器。
EM 演算法