數理統計 Cheat Sheet 15:檢驗假設問題的 p 值法
設總體 $X \sim N(\mu, \sigma^2)$,$\mu$ 未知,$\sigma^2 = 100$,現有樣本 $x_1, x_2, \cdots, x_{52}$,算得 $\overline x = 62.75$,現在來檢驗假設
\begin{equation}
H_0: \mu \leq \mu_0 = 60, \quad H_1: \mu > 60
\end{equation}
採用 $Z$ 檢驗法,檢驗統計量為
\begin{equation}
Z = \frac{\overline X – \mu_0}{\sigma / \sqrt{n}}
\end{equation}
代入資料,得 $Z$ 的觀察值為
\begin{equation}
z = \frac{62.75 – 60}{10 / \sqrt{52}} = 1.983
\end{equation}
概率
\begin{equation}
P\{Z \geq z_0\} = P\{Z \geq 1.983\} = 1 – \Phi(1.983) = 0.0238
\end{equation}
此概率稱為 $Z$ 檢驗法的右邊檢驗的 $p$ 值,記為
\begin{equation}
P\{Z \geq z_0\} = p\;值(= 0.0238)
\end{equation}
若顯著性水平 $\alpha \geq p = 0.0238$,則對應的臨界值 $z_\alpha \leq 1.983$,這表示觀察值 $z_0 = 1.983$ 落在拒絕域內,因而拒絕 $H_0$;又若 $\alpha < p = 0.0238$,則對應的臨界值 $z_\alpha > 1.983$,這表觀察值 $z_0 = 1.983$ 不落在拒絕域內,因而接受 $H_0$。
定義假設檢驗的 $p$ 值(Probability Value)是由檢驗統計量的樣本觀察值得出的原假設可被拒絕的最小顯著性水平。
常用的檢驗問題的 $p$ 值可以根據檢驗統計量的樣本觀察值以及檢驗統計量在 $H_0$ 下一個特定引數值(一般是 $H_0$ 與 $H_1$ 所規定的引數的分界點)對應的分佈求出。例如在正態總體 $N(\mu, \sigma^2)$ 均值的檢驗中,當 $\sigma$ 未知時,可採用檢驗統計量 $t = \frac{\overline X – \mu_0}{S / \sqrt{n}}$,在一下三個檢驗問題中,當 $\mu = \mu_0$ 時 $t \sim t(n – 1)$。如果由樣本求得統計量 $t$ 的觀察值為 $t_0$,那麼
(1)在檢驗問題
\begin{equation}
H_0: \mu \leq \mu_0, \quad H_1: \mu > \mu_0
\end{equation}
中,
\begin{equation}
p\;值 = P_{\mu_0} \{t \geq t_0\} = t_0\;右側尾部面積
\end{equation}
(2)在檢驗問題
\begin{equation}
H_0: \mu \geq \mu_0, \quad H_1: \mu < \mu_0
\end{equation}
中,
\begin{equation}
p\;值 = P_{\mu_0} \{t \leq t_0\} = t_0\;左側尾部面積
\end{equation}
(3)在檢驗問題
\begin{equation}
H_0: \mu = \mu_0, \quad H_1: \mu \neq \mu_0
\end{equation}
中,
(i) 當 $t_0 > 0$ 時
\begin{align}
p\;值 &= P_{\mu_0} \{|t| \geq t_0 \} = P_{\mu_0} \{ (t \leq -t_0) \cup (t \geq t_0) \}
&= 2 \times (t_0\;右側尾部面積)
\end{align}
(ii) 當 $t_0 < 0$ 時
\begin{align}
p\;值 &= P_{\mu_0} \{|t| \geq -t_0 \} = P_{\mu_0} \{ (t \leq t_0) \cup (t \geq -t_0) \}
&= 2 \times (t_0\;左側尾部面積)
\end{align}
綜合(i)、(ii),$p\;值 = 2 \times (由\;t_0\;界定的尾部面積)$。
按 $p$ 值的定義,對於任意指定的顯著性水平 $\alpha$,就有
- 若 $p\;值 \leq \alpha$,則在顯著性水平 $\alpha$ 下拒絕 $H_0$。
- 若 $p\;值 > \alpha$,則在顯著性水平 $\alpha$ 下接受 $H_0$。
由此就可以方便地確定是否拒絕 $H_0$。這種利用 $p$ 值來確定是否拒絕 $H_0$ 的方法稱為 $p$ 值法。而前文中討論的假設檢驗方法稱為臨界值 法。
用臨界值法來確定 $H_0$ 的拒絕域時,例如當取 $\alpha = 0.05$ 時知道要拒絕 $H_0$,再取 $\alpha = 0.01$ 也要拒絕 $H_0$,但不能知道將 $\alpha$ 在降低一些是否也要拒絕 $H_0$。而 $p$ 值法給出了拒絕 $H_0$ 的最小顯著性水平。因此 $p$ 值法比臨界值法給出了有關拒絕域的更多資訊。
$p$ 值表示反對原假設 $H_0$ 的依據的強度,$p$ 值越小,反對 $H_0$ 的依據越強、越充分。一般,若 $p\;值\leq 0.01$,則稱推斷拒絕 $H_0$ 的依據很強,或稱檢驗是高度顯著的;若 $0.01 < p\;值 < 0.05$,稱推斷拒絕 $H_0$ 的依據是強的,檢驗是顯著的;若 $0.05 < p\;值 < 0.1$,稱推斷拒絕 $H_0$ 的依據是弱的,檢驗是不顯著的;若 $p\;值 > 0.1$,一般來說沒有理由拒絕 $H_0$。