1. 程式人生 > >查缺補漏(2)

查缺補漏(2)

結果 endpoint lan 如何 得到 標準差 維基 過程 例子

問題1

怎麽理解置信區間(Confidence Interval【CI】)?

參考維基百科:https://en.wikipedia.org/wiki/Confidence_interval做出的理解:

置信區間是一種區間估計。給定置信水平$\alpha$,意味著計算得到對應的置信區間有$(1-\alpha)*100\%$的可能覆蓋了參數的真實值。

對於同一個分布的隨機變量,我們獲取的樣本可能不盡相同,如果我們能夠從總體中得到無數的樣本集,那麽從這些樣本集計算得到的無數個不同或相同的置信區間,將有$(1-\alpha)*100\%$的比例是包含了參數的真實值的。不是每一個置信區間都能夠覆蓋參數的真實值。

舉例說明

有一個可以給杯子盛上液體的機器,並且每次盛裝液體的重量應該調整為250g。由於機器不能每次都精準地為杯子盛上250g,而是會有一些變動,所以應該把每次盛液體的重量當成一個隨機變量X。假設X服從均值為250g,標準差$\sigma=2.5g$的正態分布。要判斷這個機器是不是充分校準了,我們隨機抽取了$\text{n}=25$個杯子的液體作為樣本,並測得它們的重量,得到$X$的一份隨機樣本$X_1, X_2, ..., X_{25}$。

一個合適的對期望$\mu$的估計是樣本均值 \[{\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.\]

對於這份樣本,實際的重量均值為:\[{\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2{\text{ grams}}.\]

如果我們取得另一份樣本,很有可能計算出來的均值會是 250.4 或者 251.1 grams,等等。如果均值是280 grams的話,相比於實際重量應該接近250 grams的情況而言,這個數字就有些極端了。存在觀測值為250.2 grams 的一個鄰域(區間),如果總體均值是這個區間中的某個值,都不會認為是不尋常的。這樣的一個區間就稱為參數$\mu$的置信區間。

這個區間應該如何計算出來?

區間的端點從樣本計算得到,所以它們是統計量,是樣本$X_1, X_2, ..., X_{25}$的函數,本質也是隨機變量。

在這個例子中,我們根據服從正態分布的樣本均值也服從正態分布這一點來計算置信區間的端點值,樣本均值的期望不變,標準差則變為

\[{\frac {\sigma }{\sqrt {n}}}={\frac {2.5{\text{ g}}}{\sqrt {25}}}=0.5{\text{ grams}}\]

通過標準化後得到一個依賴於被估計的μ隨機變量:

\[Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}\]

但這個隨機變量的分布——標準正態分布,卻不依賴於μ。所以找到和 μ獨立的 ?zz,使得隨機變量 Z在兩個值之間的概率為1-α,或者說決定置信水平為α,是可能的。

取 1 ? α = 0.95作例,則有

\[P(-z\leq Z\leq z)=1-\alpha =0.95.\]

根據z服從卷積正態分布函數(cumulative normal distribution function),有:

\[{\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}\]

從而得到

\[{\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right).\end{aligned}}\]

換句話說,95%的置信區間的下界是:

\[ {\text{Lower endpoint}}={\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}},\]

上界是:

\[ {\text{Upper endpoint}}={\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}.\]

所以在這個例子中,置信區間為:

\[{\begin{aligned}0.95&=\Pr({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5)\\[6pt]&=\Pr({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98).\end{aligned}}\]

這個例子中,標準差$\sigma$是已知的,樣本均值${\bar{X}}$的分布是只有$\mu$一個未知參數的正態分布。在其他理論例子,$\sigma$有可能也是未知的,這個時候則應該使用學生T分布(Student‘s t-distribution.)。

----------

兩個之前有些模糊的點,我現在這樣理解:

1. 在通過置信區間計算置信水平,或者確定置信水平再計算置信區間的過程,我們都基於了樣本服從我們指定的分布這樣一個假設。

在實際中,除非這個數據是通過模擬得到的,否則很難保證這個假設是成立的。置信區間,本身也只是一個估計而已。它是不是達到了我們期望的置信水平,也是不知道的。

或許也可以通過蒙特卡洛方法做一個大概的估計,但是也還是估計而已。

2. (在假設成立的條件下)可以這樣理解上面出現的概率。

1)指在參數已知的情況下,出現該統計量結果處於置信區間範圍的概率(因為最開始是$P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)$);

2)指根據該統計量結果,對應參數可能被計算得到的置信區間覆蓋的概率。

查缺補漏(2)