通過一個案例分析貝葉斯公式與機器識別

阿新 • • 發佈：2018-01-21

機器學習描述事件滿足 image pos div 是個頻率

貝葉斯公式定義如下，

技術分享圖片

公式大家都知道，如何理解呢？下面給一個機器識別相關的例子，直觀地說明。

在機器識別中，假設機器要識別“一”所在的這個小圖像塊表示什麽字符（可以想象為拿手機對著一頁書拍了張照片，機器要認出照片中“一”這個區域代表的是什麽字）。

我們先看“一”字在幾何上的特點是什麽呢？大概認為是寬高比很大 + 寬度與整篇文章的平均字寬度相當 + 縱向位置在其所在行的中間位置附近。

其中

“待識別的圖像是一” 是 “事件”，

“寬高比很大 + 寬度與整篇文章的平均字寬度相當 + 縱向位置在其所在行的中間位置附近” 是 “信息”，

則 P(信息|事件) 的物理意義為，在圖像代表的字符為“一”的情況下，它的幾何特點為 “寬高比很大 + 寬度與整篇文章的平均字寬度相當 + 縱向位置在其所在行的中間位置附近” 的概率。

基本上，在編寫類似OCR這樣的模式識別軟件時，我們都需要做數據字典，此時每個字符到底是什麽是已知的，要做的是盡量準確地提出其特征。對這個例子而言就是要提取字符“一”的幾何特點描述，固化為數據字典中“一”這個內碼對應的描述數據。用貝葉斯公式的語音來說，就是要不斷修正 P(信息|事件)。

再看，

P(信息)表示什麽呢？表示在所有待識別的圖像小方塊中，滿足 “寬高比很大 + 寬度與整篇文章的平均字寬度相當 + 縱向位置在其所在行的中間位置附近” 這個幾何特點的小方塊占所有小方塊的比例是多少，或者說概率是多少。

P(事件)，表示“一”這個字的字頻，也即是在所有文章中出現“一”的概率有多少（我們認為機器需要識別所有的中文文章）

現在來看 P(事件|信息)，

P(事件|信息) 表示當軟件遇到一個小圖像塊，而這個小圖形塊的幾何特點是“寬高比很大 + 寬度與整篇文章的平均字寬度相當 + 縱向位置在其所在行的中間位置附近”時，它是“一”的概率 —— 可以認為這就是對機器識別，或人工智能最簡單的描述。

可以看到，

1. P(事件|信息)與 P(信息|事件)正相關，這表示我們在進行機器學習訓練時，對“一”的幾何特征訓練得越精確（即是P(信息|事件)越大），則在對實際樣張的識別中，遇到這樣的幾何特征時，將它識別為“一”是正確的概率越高（即是P(事件|信息)越大）。

2. P(事件|信息)與 P(信息)負相關，這表示如果很多待識別的小圖像方塊幾何特點都是“寬高比很大 + 寬度與整篇文章的平均字寬度相當 + 縱向位置在其所在行的中間位置附近”（P(信息)很大），就意味著“如果這麽多字符的特點都是這個吊樣，那麽我就沒把握說它恰好是“一”了”（P(事件|信息)很小）；反之，如果只有“一“的特點是“寬高比很大 + 寬度與整篇文章的平均字寬度相當 + 縱向位置在其所在行的中間位置附近”（P(信息)很小），其它字符的特點都不是這樣，那我遇到這個具有這個特點的小圖像塊，就可以信心滿滿地說它就是“一”字了（P(事件|信息)很大）。

3. P(事件|信息)與 P(事件)正相關，這表示如果“一”的字頻很高、在所有的文章中出現的頻率很高（P(事件)大），那我說待識別的小圖像塊是“一”的正確性概率當然就比較高（P(事件|信息)大）；反之，如果“一”是個生僻字，在一般的文章中根本就沒出現過幾次（P(事件)小），那我說待識別的小圖像塊是“一”的正確性概率當然也就比較低了（P(事件|信息)小）。

通過一個案例分析貝葉斯公式與機器識別

機器學習描述事件滿足 image pos div 是個頻率貝葉斯公式定義如下，公式大家都知道，如何理解呢？下面給一個機器識別相關的例子，直觀地說明。在機器識別中，假設機器要識別“一”所在的這個小圖像塊表示什麽字符（可以想象為拿手機對著一頁書拍了張照片，機器要

通過一個案例分析貝葉斯公式與機器識別

通過一個案例分析貝葉斯公式與機器識別

貝葉斯公式與搜尋引擎

通過簡單例子來理解先驗分佈、後驗分佈、似然估計&&貝葉斯公式

從一個小例子看貝葉斯公式的應用（學習簡單、基礎、入門的例子）

記一道貝葉斯公式的裸題

貝葉斯公式由淺入深大講解—AI基礎算法入門

【機器學習基本理論】詳解最大似然估計（MLE）、最大後驗概率估計（MAP），以及貝葉斯公式的理解

貝葉斯公式推導

【概率論】條件概率 & 全概率公式 & 樸素貝葉斯公式

ML15理解MLE-MAP-貝葉斯公式

KMeams算法應用：圖片壓縮與貝葉斯公式理解

KMEAMS演算法應用：圖片壓縮與貝葉斯公式理解

大資料背後的神祕公式（上）：貝葉斯公式

從貝葉斯公式到垃圾郵件的識別

貝葉斯公式理解（先驗概率/後驗概率）

概率論中的條件概率-全概率-貝葉斯公式

詳解最大似然估計（MLE）、最大後驗概率估計（MAP），以及貝葉斯公式的理解

多變數條件概率公式的推導(多變數貝葉斯公式)

[work*] 貝葉斯公式的通俗解釋

全概率公式、貝葉斯公式（二）

通過一個案例分析貝葉斯公式與機器識別

相關推薦