1. 程式人生 > >【數學基礎】無偏估計——為何樣本方差需要除以(n-1)?

【數學基礎】無偏估計——為何樣本方差需要除以(n-1)?

  
   相信在學習數理統計過程中,肯定很多人會下面這樣的疑問

為什麼樣本方差是除以(n-1),而不是除以n呢?

  那麼今天就一起來看一下是為什麼。

##背景知識
   為了方便後面的表述,我們用 Xˉ\bar{X} 表示樣本均值,用 S2S^{2} 表示樣本方差,用 uu 表示總體均值,用 σ2\sigma ^{2} 表示總體方差。

總體方差

  整體方差的求得過程如下;
σ2=D(X)=E((XiE(X))2)=E(Xi22XiE(X)+E(X)2)=1n(i=1n(Xi2)2i=1nXiE(X)+nE(X)2) \begin{aligned} \sigma^{2} =D(X)&=E((X_{i}-E(X))^{2})\\ &=E(X_{i}^{2}-2X_{i}E(X)+E(X)^{2})\\ &=\frac{1}{n}(\sum_{i=1}^{n}(X_{i}^{2})-2\sum_{i=1}^{n}X_{i}E(X)+nE(X)^{2}) \end{aligned}


  由於i=1nXi=nE(X)\sum_{i=1}^{n}X_{i}=nE(X) ,所以可得;
σ2=D(X)=E((XiE(X))2)=1n(i=1n(Xi2)nE(X)2)=E(X2)E(X)2 \begin{aligned} \sigma^{2}=D(X) &=E((X_{i}-E(X))^{2})\\ &=\frac{1}{n}(\sum_{i=1}^{n}(X_{i}^{2})-nE(X)^{2})\\ &=E(X^{2})-E(X)^{2} \end{aligned}

樣本方差

S2=1n1i=1n(XiXˉ)2S^{2}=\frac{1}{n-1}\sum_{i=1}^{n}(X_{i}-\bar{X})^{2}

中心極限定理

   設從均值為uu,方差為σ2\sigma^{2} 的一個任意總體中抽取容量為nn的樣本,當n 充分大的時候,樣本均值的抽樣分佈服從N(u,σ2/n)N(u,\sigma^{2}/n) 的分佈,即;
E(Xˉ)=uD(Xˉ)=σ2/n \begin{aligned} E(\bar{X})&=u\\ D(\bar{X})&=\sigma ^{2}/n \end{aligned}

無偏估計

   如果 θ^\hat{\theta } 的期望等於 θ\theta ,則稱 θ^\hat{\theta }θ\theta 的無偏估計量,即
E(θ^)=θ E(\hat{\theta })=\theta
   例如樣本均值Xˉ\bar{X} 是總體均值的無偏估計。
E(Xˉ)=1ni=1nE(Xi)=E(X)=uE(\bar{X})=\frac{1}{n}\sum_{i=1}^{n}E(X_{i})=E(X)=u

  所有的前期準備工作就此結束了。

判斷S2S^{2}是否是σ2\sigma ^{2}的無偏估計

  先假設 S~2=1ni=1n(XiXˉ)2\tilde{S}^{2}=\frac{1}{n}\sum_{i=1}^{n}(X_{i}-\bar{X})^{2};那麼求E(S~2)E(\tilde{S}^{2})
E(S~2)=E(1ni=1n(XiXˉ)2)=E(1n(i=1nXi2nXˉ2))=1n(nE(X2)nE(Xˉ2)) \begin{aligned} E(\tilde{S}^{2})&=E(\frac{1}{n}\sum_{i=1}^{n}(X_{i}-\bar{X})^{2})\\ &=E(\frac{1}{n}(\sum_{i=1}^{n}X_{i}^{2}-n\bar{X}^{2}))\\ &=\frac{1}{n}(nE(X^{2})-nE(\bar{X}^{2}))\\ \end{aligned}
  由於σ2=D(X)=E(X2)E(X)2\sigma^{2}=D(X)=E(X^{2})-E(X)^{2} ,且樣本均值服從N(u,σ2/n)N(u,\sigma^{2}/n) 的分佈所以;
E(S~2)=E(1n1i=1n(XiXˉ)2)=E(1n(i=1nXi2nXˉ2))=1n(nE(X2)nE(Xˉ2))=1n(n(σ2+u2)n(D(Xˉ)+u2))=1n(nσ2+nu2σ2nu2)=n1nσ2 \begin{aligned} E(\tilde{S}^{2})&=E(\frac{1}{n-1}\sum_{i=1}^{n}(X_{i}-\bar{X