1. 程式人生 > >通過一個案例分析貝葉斯公式與機器識別

通過一個案例分析貝葉斯公式與機器識別

機器學習 描述 事件 滿足 image pos div 是個 頻率

貝葉斯公式定義如下,

技術分享圖片

公式大家都知道,如何理解呢?下面給一個機器識別相關的例子,直觀地說明。

在機器識別中,假設機器要識別“一”所在的這個小圖像塊表示什麽字符(可以想象為拿手機對著一頁書拍了張照片,機器要認出照片中“一”這個區域代表的是什麽字)。

我們先看“一”字在幾何上的特點是什麽呢?大概認為是 寬高比很大 + 寬度與整篇文章的平均字寬度相當 + 縱向位置在其所在行的中間位置附近。

其中

“待識別的圖像是一” 是 “事件”,

“寬高比很大 + 寬度與整篇文章的平均字寬度相當 + 縱向位置在其所在行的中間位置附近” 是 “信息”,

則 P(信息|事件) 的物理意義為, 在圖像代表的字符為“一”的情況下, 它的幾何特點為 “寬高比很大 + 寬度與整篇文章的平均字寬度相當 + 縱向位置在其所在行的中間位置附近” 的概率。

基本上,在編寫類似OCR這樣的模式識別軟件時,我們都需要做數據字典,此時每個字符到底是什麽是已知的,要做的是盡量準確地提出其特征。對這個例子而言就是要提取字符“一”的幾何特點描述,固化為數據字典中“一”這個內碼對應的描述數據。用貝葉斯公式的語音來說,就是要不斷修正 P(信息|事件)。

再看,

P(信息)表示什麽呢? 表示在所有待識別的圖像小方塊中,滿足 “寬高比很大 + 寬度與整篇文章的平均字寬度相當 + 縱向位置在其所在行的中間位置附近” 這個幾何特點的小方塊占所有小方塊的比例是多少,或者說概率是多少。

P(事件),表示“一”這個字的字頻, 也即是在所有文章中出現“一”的概率有多少(我們認為機器需要識別所有的中文文章)

現在來看 P(事件|信息),

P(事件|信息) 表示 當軟件遇到一個小圖像塊,而這個小圖形塊的幾何特點是“寬高比很大 + 寬度與整篇文章的平均字寬度相當 + 縱向位置在其所在行的中間位置附近”時, 它是“一”的概率 —— 可以認為這就是對機器識別,或人工智能最簡單的描述。

可以看到,

1. P(事件|信息)與 P(信息|事件)正相關,這表示我們在進行機器學習訓練時,對“一”的幾何特征訓練得越精確(即是P(信息|事件)越大),則在對實際樣張的識別中,遇到這樣的幾何特征時,將它識別為“一”是正確的概率越高(即是P(事件|信息)越大)。

2. P(事件|信息)與 P(信息)負相關,這表示如果很多待識別的小圖像方塊幾何特點都是“寬高比很大 + 寬度與整篇文章的平均字寬度相當 + 縱向位置在其所在行的中間位置附近”(P(信息)很大), 就意味著“如果這麽多字符的特點都是這個吊樣,那麽我就沒把握說它恰好是“一”了”(P(事件|信息)很小);反之,如果只有“一“的特點是“寬高比很大 + 寬度與整篇文章的平均字寬度相當 + 縱向位置在其所在行的中間位置附近”(P(信息)很小),其它字符的特點都不是這樣,那我遇到這個具有這個特點的小圖像塊,就可以信心滿滿地說它就是“一”字了(P(事件|信息)很大)。

3. P(事件|信息)與 P(事件)正相關,這表示如果“一”的字頻很高、在所有的文章中出現的頻率很高(P(事件)大),那我說待識別的小圖像塊是“一”的正確性概率當然就比較高(P(事件|信息)大);反之,如果“一”是個生僻字,在一般的文章中根本就沒出現過幾次(P(事件)小),那我說待識別的小圖像塊是“一”的正確性概率當然也就比較低了(P(事件|信息)小)。

通過一個案例分析貝葉斯公式與機器識別