似然與概率的通俗理解
1. 極大似然估計
假設有一枚硬幣,我們想確定這枚硬幣是否質地均勻。即想知道拋這枚硬幣,正反面出現的概率各是多少?於是我們將這枚硬幣拋了10次,得到的資料x0是:反正正正正反正正正反。我們想求的正面概率θ是模型引數,而拋硬幣模型可以假設服從二項分佈。
那麼,出現實驗結果x0(反正正正正反正正正反)的似然函式是多少呢?
而極大似然估計,顧名思義,就是要最大化這個函式。
我們可以畫出f(θ)的影象:
從影象中可以觀察到,θ=0.7時,函式取值最大。也就是說,我們通過最大化似然函式後,得到了模型引數的值,相應的,正反面出現的概率也就求出了。
極大似然估計需要保證所有的取樣都是獨立同分布的。
2. 容易混淆的概念
- 極大似然估計就是最大似然估計。
- 極大似然概率這個名詞描述是不準確的,筆者查閱了整個英文網際網路,都沒有找到 ‘Maximum likelihood probability’這個詞。所以,不存在“極大似然概率”這個說法。
3. 最大後驗概率
與極大似然估計相比,使用最大後驗概率估計θ時,首先認為θ本身存在一個分佈,即θ有先驗分佈。
還是以判斷一枚硬幣是否質地均勻為例。假設正面概率θ滿足均值為0.5,方差為1的先驗分佈,即:
那麼,將這枚硬幣拋了10次,得到的資料x0是:反正正正正反正正正反。
因為考慮了先驗分佈,所以實驗結果x0的函式可以表示為:
因此,我們可以通過最大化這個後驗概率函式求得θ,我們可以畫出f(θ)的影象:
計算得到θ = 0.696。也就是說,採用最大後驗概率計算得到硬幣正面朝上的概率為0.696。
4. 似然與概率分別指的什麼
似然: 英文單詞為likelihood,有道翻譯的翻譯結果為:十有八九。
概率: 如果我有一枚質地均勻的硬幣,那麼它出現正面朝上的概率是0.5。
似然: 如果我拋一枚硬幣100次,正面朝上52次,那麼它十有八九是質地均勻的。
再舉一個例子加深理解。 假設有人向我挑戰一個“有利可圖的賭博遊戲”。
概率: 幫助我們計算預期的收益和損失(平均值、眾數、中值、方差、資訊比率、風險值、賭徒破產等等)。
似然: 幫助我們量化是否首先應該相信那些概率。
實際上,似然幾乎可以等價於置信度。