1. 程式人生 > >統計學習方法 李航 第一章習題

統計學習方法 李航 第一章習題

1.1說明伯努利模型的極大似然估計以及貝葉斯估計中的統計學習方法三要素。伯努利模型是定義在取值為0和1的隨機變數上的概率分佈。假設觀測到的伯努利模型n次獨立資料生成結果,其中k次的結果為1,這時可以用極大似然估計或貝葉斯估計來估計結果為1的概率。

用極大似然估計

L(θ)=f(x_1,x_2,...x_n|θ)=Ck_nθ_k(1θ)nk
直接求一階導數另其等於零
kθk1(1θ)nk(nk)θk(1θ)nk1=0
θ̂ _ML=arg max_θL(θ|x)
得到01k/n 三個解

用極大後驗估計

θ̂ _MAP=arg max_θP(X|θ)P(θ

)P(X)=arg max_θlog[P(X|θ)P(θ)]=arg max_θ(L(θ|X)+log(P(θ)))
與最大似然估計相比,現在需要多加上一個先驗分佈概率的對數。在實際應用中,這個先驗可以用來描述人們已經知道或者接受的普遍規律。例如在扔硬幣的試驗中,每次丟擲正面發生的概率應該服從一個概率分佈,這個概率在0.5處取得最大值,這個分佈就是先驗分佈。先驗分佈的引數我們稱為超引數。

用貝葉斯估計

貝葉斯估計是在MAP上做進一步拓展,此時不直接估計引數的值,而是允許引數服從一定概率分佈。
P(θ̂ |X)=_θΘP(x̂ |θ)P(θ|X)dθ=_θΘP(x̂ |θ)

P(X|θ)P(θ)P(X)dθ

1.2通過經驗風險最小化推導極大似然估計,證明模型是條件概率分佈,損失函式是對數損失函式時,經驗風險最小化等價於極大似然估計