1. 程式人生 > >【論文筆記】T Test

【論文筆記】T Test

nor thum pan n-1 統計學 for nes 其它 align

用來算兩組數的差別大小 
只要是一種叫做p-value的
就是說假如你測定一個實驗的p-value是5%
也就是說你有95%的信心確定這個實驗它是正確的

在正規的實驗裏 只有當p-value小於5%的時候這個實驗才算是可以在報告中提及
數值越小代表實驗數據越精確 可信度越高


T檢驗,亦稱student t檢驗(Student‘s t test),主要用於樣本含量較小(例如n<30),總體標準差σ未知的正態分布資料。

T檢驗是用於小樣本(樣本容量小於30)的兩個平均值差異程度的檢驗方法。它是用T分布理論來推斷差異發生的概率,從而判定兩個平均數的差異是否顯著。

T檢驗是戈斯特為了觀測釀酒質量而發明的。戈斯特在位於都柏林的健力士釀酒廠擔任統計學家,基於Claude Guinness聘用從牛津大學和劍橋大學出來的最好的畢業生以將生物化學及統計學應用到健力士工業程序的創新政策。戈特特於1908年在Biometrika上公布T檢驗,但因其老板認為其為商業機密而被迫使用筆名(學生)。實際上,戈斯特的真實身份不只是其它統計學家不知道,連其老板也不知道。

T檢驗的適用條件:正態分布資料

T檢驗的步驟
1、建立虛無假設H0:μ1 = μ2,即先假定兩個總體平均數之間沒有顯著差異;

2、計算統計量T值,對於不同類型的問題選用不同的統計量計算方法;

1)如果要評斷一個總體中的小樣本平均數與總體平均值之間的差異程度,其統計量T值的計算公式為:

2)如果要評斷兩組樣本平均數之間的差異程度,其統計量T值的計算公式為:

3、根據自由度df=n-1,查T值表,找出規定的T理論值並進行比較。理論值差異的顯著水平為0.01級或0.05級。不同自由度的顯著水平理論值記為T(df)0.01和T(df)0.05 這個就是我說的那個p-value= =

4、比較計算得到的t值和理論T值,推斷發生的概率,依據下表給出的T值與差異顯著性關系表作出判斷。

t檢驗分為單總體檢驗和雙總體檢驗

單總體t檢驗

檢驗一個樣本平均數與一個已知的總體平均數的差異是否顯著。當總體分布是正態分布,如總體標準差未知且樣本容量小於30,那麽樣本平均數與總體平均數的離差統計量呈t分布。 單總體t檢驗統計量為: 技術分享圖片 其中 技術分享圖片 為樣本平均數, 技術分享圖片 為樣本標準偏差,n為樣本數。該統計量t在零假說:μ=μ0為真的條件下服從自由度為n−1的t分布。

單個樣本的t檢驗實例分析

例1 難產兒出生體重 技術分享圖片

  一般嬰兒出生體重μ0

= 3.30(大規模調查獲得),問相同否?

  解:1.建立假設、確定檢驗水準α

  H0:μ = μ0 (難產兒與一般嬰兒出生體重的總均數相等;H0無效假設,null hypothesis)

  技術分享圖片(難產兒與一般嬰兒出生體重的總均數不等;H1備擇假設,alternative hypothesis,)

  雙側檢驗,檢驗水準:α = 0.05

   2.計算檢驗統計量

  技術分享圖片

  3.查相應界值表,確定P值,下結論

  查附表1: t0.05 / 2.34 = 2.032,t = 1.77,t < t0.05 / 2.34,P > 0.05,按α = 0.05水準,不拒絕H0,兩者的差別無統計學意義,尚不能認為難產兒平均出生體重與一般嬰兒的出生體重不同

  技術分享圖片

雙總體t檢驗

是檢驗兩個樣本平均數與其各自所代表的總體的差異是否顯著。雙總體t檢驗又分為兩種情況,一是獨立樣本t檢驗,一是配對樣本t檢驗。 獨立樣本t檢驗統計量為: 技術分享圖片 S12和 S22為兩樣本方差;n1 和n2 為兩樣本容量。 樣本量相同的情況下 如果兩個樣本中一個的方差為零 則二樣本異方差t檢驗和單樣本t檢驗統計量完全一致

【論文筆記】T Test