1. 程式人生 > >引數估計和最大似然估計

引數估計和最大似然估計

點估計

設總體XX的分佈函式的形式已知,但它的一個或多個引數未知,藉助於總體XX一個樣本來估計總體未知引數的值得問題稱為引數的點估計問題。

舉例:
某炸藥廠,一天中發生著火現象的次數XX是一個隨機變數,假設XX服從λ>0\lambda>0泊松分佈,即Xπ(λ)X \sim \pi(\lambda)。根據現有的樣本量估計引數λ\lambda

著火次數k 0 1 2 3 4 5 6 >=7
發生k次著火的天數 75 90 54 22 6 2 1 0

根據λ=E(X)\lambda=E(X),以上的資料表示X

=0X=0出現了75次,X=1X=1出現了90次…,一共有250個樣本
E(X)=0×75+1×90+2×54+3×22+4×6+5×2+6×1250=1.22E(X)=\frac{0 \times 75+1 \times 90 +2 \times 54+3 \times 22 +4 \times 6 + 5 \times 2+ 6 \times 1}{250}=1.22
所以估計引數λ=1.22\lambda=1.22

點估計:設總體XX的分佈函式F(x;θ)F(x;\theta)的形式為已知,θ

\theta是待估引數,X1,X2,...,XnX_{1},X_{2},...,X_{n}XX的一個樣本,x1,x2,...,xnx_{1},x_{2},...,x_{n}是對應的樣本值。點估計問題是構造出一個適當的統計量θ^(X1,X2,...,Xn)\hat{\theta}(X_{1},X_{2},...,X_{n}),用它的觀察值θ^(x1,x2,...,xn)\hat{\theta}(x_{1},x_{2},...,x_{n})作為未知引數θ\theta
的近似值,稱θ^(X1,X2,...,Xn)\hat{\theta}(X_{1},X_{2},...,X_{n})θ\theta的估計量,θ^(x1,x2,...,xn)\hat{\theta}(x_{1},x_{2},...,x_{n})θ\theta的估計值。
下面介紹兩種常用的構造估計量的方法:矩估計和最大似然估計
##矩估計法
XX為連續型隨機變數,其概率密度為f(x:θ1,θ2,...,θk)f(x:\theta_{1}, \theta_{2},...,\theta_{k});或XX為離散型隨機變數,其概率密度為P{X=x}=p(x;θ1,θ2,...,θk)P\{X=x\}=p(x;\theta_{1}, \theta_{2},...,\theta_{k}),其其中θ1,θ2,...,θk\theta_{1}, \theta_{2},...,\theta_{k}為待估引數。假設總體XXkk階矩為:
μl=E(Xl)=xlf(x:θ1,θ2,...,θk)dx,(X)\mu_{l}=E(X^{l})=\int_{-\infty}^{\infty}x^{l}f(x:\theta_{1}, \theta_{2},...,\theta_{k}) dx,(X是連續型)
μl=E(Xl)=xRxxlp(x;θ1,θ2,...,θk),(X)\mu_{l}=E(X^{l})=\sum_{x \in R_{x}}x^{l}p(x;\theta_{1}, \theta_{2},...,\theta_{k}),(X是離散型)
l=1,2, ,kl=1,2,\cdots,k
其中,RxR_{x}xx可能取值的範圍。
X1,X2,...,XnX_{1},X_{2},...,X_{n}是來自XX的樣本,樣本矩為Al=1ni=1nXilA_{l}=\frac{1}{n}\sum_{i=1}^{n}X_{i}^{l}
樣本矩依概率收斂於相應的總體矩ulu_{l},樣本矩的連續函式依概率收斂於相應的總體矩的連續函式。因此,可以使用樣本矩作為相應的總體矩的估計量,樣本矩的連續函式作為相應的總體矩的連續函式的估計量,此估計法被稱為矩估計法。具體做法如下:
{μ1=μ1(θ1,θ2, ,θk)μ2=μ2(θ1,θ2, ,θk)μk=μk(θ1,θ2, ,θk)\left\{\begin{matrix} \mu_{1}=\mu_{1}(\theta_{1},\theta_{2},\cdots ,\theta_{k})\\ \mu_{2}=\mu_{2}(\theta_{1},\theta_{2},\cdots ,\theta_{k})\\ \cdots\\ \mu_{k}=\mu_{k}(\theta_{1},\theta_{2},\cdots ,\theta_{k}) \end{matrix}\right.