1. 程式人生 > >最大似然與正太分佈

最大似然與正太分佈

這兩個詞語都是概率論中見的詞語,乍一看沒有什麼聯絡。最近看了斯坦福的機器學習課程,其中有對於迴歸問題的均方誤差函式的由來進行的仔細論述,我認為十分有意思,就寫了部落格來記錄一下。

最大似然:簡單來說,就是不斷調整模型的引數,使已知發生的事件的概率是最大的。

正態分佈密度函式: 12πσexp(xμ)22σ2 其中 σ 代表標準差,μ代表平均值。

對於一個迴歸問題,我們f(x)儘量的去擬合y。如果我們假設所有的誤差都是服從正太分佈的則有 f(x)=y+ ϵ 由於誤差服從均值為0,方差為1的正太分佈,因此所有樣本的聯合概率密度為
ni=112πexp(f(xi

)yi)22
我們要最大化上述式子,等價於最小化ni=1(f(xi)yi)2。 而它正是均方誤差函式,也就是說我們在迴歸問題中用極大似然思想推匯出了均方誤差函式。

(注:連續型隨機變數聯合分佈用密度函式來估計,離散型隨機變數聯合分佈用概率來估計)