貝葉斯分類器(二)
不同特徵獨立性假設條件下的貝葉斯分類器介紹
在貝葉斯分類器(一)一節,我們簡要證明了貝葉斯分類器相較於其他判別規則具有最小誤分類概率。我們知道貝葉斯分類的關鍵包括對類先驗概率的確定以及類樣本概率密度的確定。當使用不同的方法估計類樣本概率密度時,我們基於貝葉斯分類(後驗概率最大化)所得到的分類結果也有所不同。例如,我們可以假設觀測樣本的所有特徵間均相互獨立,也可以假設部分特徵間相互依賴、部分特徵相獨立,或者我們也可以假設所有特徵間均存在依賴關係,基於不同的假設我們可以得到不同的概率密度估計,由此也產生了不同的分類結果。接下來分別介紹不同特徵依賴假設條件下的概率密度估計方法。
樸素貝葉斯模型
當我們假設觀測樣本的所有維特徵間均相互獨立時,我們可以在還大程度上簡化類概率密度的估計過程,另一方面,特徵獨立性的假設能夠有效避免高維空間維災難的產生。
考慮一個多分類問題,樣本可能的取值有共計類,其中樣本為維空間中的一個觀測樣本,。我們對每一類分別進行後驗概率密度估計,則第類的後驗概率可以表示為: 其中表示公式左右兩側相差一個乘數因子,對於本式,即為。當計算不同類在某一指定樣本下的後驗概率密度時,這一乘子保持不變,因此可以省略。只計算。在此,我們重點考慮的計算。
當假設觀測樣本維特徵均相互獨立時,我們有: 此時,對於聯合概率密度的估計被簡化為分別估計每個特徵的概率密度。
貝葉斯網路模型
在介紹貝葉斯網路模型前,我們先回顧以下條件概率的鏈式計算方法: 從上式我們可以看出,我們將之間的相互依賴關係轉化為分別反映每個特徵依賴關係圖。例如,依賴於,依賴於。在貝葉斯網路模型中,這種關係被稱為父子關係,其中,為頂層根節點,它沒有父節點,只有子節點。為底層子節點,它只有父節點,沒有子結點。
圖源:《Statistical Pattern Recognition》 187頁 上圖展示了當時的特徵間依賴關係圖示。可以看出,有5個父節點,分別為。在上圖中,6個特徵間均假設存在相關關係,而在實際中,這麼複雜的關係或許是沒有必要的,但如果我們假設所有特徵間都相互獨立,不存在相關關係(樸素貝葉斯),則可能過於簡化,難以實現較好地分類效果。貝葉斯網路模型便是介於這二者之間,用於刻畫部分變數間的相關關係的模型。 我們對上圖特徵間相關關係進行簡化,使得: 即,特徵獨立於,類似地,進行如下簡化: 簡化後的貝葉斯網路結構如下: 圖(b)是對圖(a)結構略做調整,使其更為直觀。在貝葉斯網路模型的設定中,如何決策變數間是否應當新增相關關係是重點。這一問題通常可以根據專家對實際領域資料的理解進行指定,也可以基於已有的訓練資料進行學習確定,再此不一一展開。
全相關模型
全相關即認為所有特徵間均存在相關關係,例如我們可以假設每一類觀測樣本服從維高斯分佈,對多個類,分佈擬合多個維高斯分佈。此時的貝葉斯分類器也稱之為高斯分類器。