貝葉斯網路(筆記)
阿新 • • 發佈:2018-12-31
貝葉斯定理
幾個概念:
1. 條件概率:P(A|B)=P(A⋂B)P(B) ,指在事件B發生的條件下A發生的概率。
2. 聯合概率:即A B同時發生的概率,即P(A,B)=P(A⋂B)=P(A|B)∗P(B)=P(B|A)∗P(A)
3. 邊緣概率(又稱先驗概率),邊緣概率是這樣得到的:在聯合概率中,把最終結果中那些不需要的事件通過合併成它們的全概率,而消去它們(對離散隨機變數用求和得全概率,對連續隨機變數用積分得全概率),這稱為邊緣化。貝葉斯公式:
P(A|B)=P(A⋂B)P(B)
貝葉斯網路
概念:一種概率圖模型。它是一種模擬人類推理過程中因果關係的不確定性處理模型,其網路拓樸結構是一個有向無環圖(DAG)。 圖中連線兩個節點的箭頭代表此兩個隨機變數是具有因果關係,或非條件獨立。
把某個研究系統中涉及的隨機變數,根據是否條件獨立繪製在一個有向圖中,就形成了貝葉斯網路
DAG中節點x的聯合概率:
P(x)=∏i⊂IP(xi|parent(xi))
思考
既然已經知道了什麼叫貝葉斯網路,那麼如果需要回答基於貝葉斯網路上的概率問題,又該如何去解決呢?或者說是否有一套方法去解決DAG上的概率問題?
說的更加容易懂的話,就是如果這些隨機變數不相互獨立,且相互之間有因果關係,在給定訓練集的情況下,如何通過隨機變數的值去猜測類別?
眾所周知,如果給定的隨機變數都相互獨立,要通過隨機變數的值推測類別,直接使用樸素的貝葉斯演算法就行了?
下面先了解幾個概念:
D分離:判斷DAG圖中兩個變數是否相互獨立的方法。有三種形態的鏈,各自對應不同的結論。