1. 程式人生 > >似然與概率的通俗理解

似然與概率的通俗理解

1. 極大似然估計

假設有一枚硬幣,我們想確定這枚硬幣是否質地均勻。即想知道拋這枚硬幣,正反面出現的概率各是多少?於是我們將這枚硬幣拋了10次,得到的資料x0是:正正正正正正正。我們想求的正面概率θ是模型引數,而拋硬幣模型可以假設服從二項分佈。

那麼,出現實驗結果x0(正正正正正正正)的似然函式是多少呢?

而極大似然估計,顧名思義,就是要最大化這個函式。

 

我們可以畫出f(θ)的影象:

從影象中可以觀察到,θ=0.7時,函式取值最大。也就是說,我們通過最大化似然函式後,得到了模型引數的值,相應的,正反面出現的概率也就求出了。  

極大似然估計需要保證所有的取樣都是獨立同分布的。

2. 容易混淆的概念 

  • 極大似然估計就是最大似然估計。
  • 極大似然概率這個名詞描述是不準確的,筆者查閱了整個英文網際網路,都沒有找到  ‘Maximum likelihood probability’這個詞。所以,不存在“極大似然概率”這個說法。

3. 最大後驗概率  

與極大似然估計相比,使用最大後驗概率估計θ時,首先認為θ本身存在一個分佈,即θ有先驗分佈。

還是以判斷一枚硬幣是否質地均勻為例。假設正面概率θ滿足均值為0.5,方差為1的先驗分佈,即:

那麼,將這枚硬幣拋了10次,得到的資料x0是:正正正正正正正

因為考慮了先驗分佈,所以實驗結果x0的函式可以表示為:

 因此,我們可以通過最大化這個後驗概率函式求得θ,我們可以畫出f(θ)的影象:

計算得到θ = 0.696。也就是說,採用最大後驗概率計算得到硬幣正面朝上的概率為0.696。

4. 似然與概率分別指的什麼

似然: 英文單詞為likelihood,有道翻譯的翻譯結果為:十有八九。

概率: 如果我有一枚質地均勻的硬幣,那麼它出現正面朝上的概率是0.5。

似然: 如果我拋一枚硬幣100次,正面朝上52次,那麼它十有八九是質地均勻的。

 

再舉一個例子加深理解。 假設有人向我挑戰一個“有利可圖的賭博遊戲”。

概率: 幫助我們計算預期的收益和損失(平均值、眾數、中值、方差、資訊比率、風險值、賭徒破產等等)。

似然: 幫助我們量化是否首先應該相信那些概率。

實際上,似然幾乎可以等價於置信度。