1. 程式人生 > >方差分析中均值比較的方法

方差分析中均值比較的方法

轉載:http://blog.sina.com.cn/s/blog_5de124240101q55q.html

最近看文獻時,多數實驗結果用到方差分析,但選的方法不同,主要有LSD,SNK-q,TukeyHSD法等,從百度廣庫裡找了一篇文章,大概介紹這幾種方法,具體公式不列了,軟體都可以計算。這幾種方法主要用於方差分析後,對均數間進行兩兩比較。

均數間的兩兩比較根據研究設計的不同分為兩種型別 : 一種常見於探索性研究,在研究設計階段並不明確哪些組別之間的對比是更為關注的,也不明確哪些組別問的關係已有定論、無需再探究,經方差分析結果提示 “ 概括而言各組均數不相同”後,對每一對樣本均數都進行比較,從中尋找有統計學意義的差異: 另一種是在設計階段根據研究目的或專業知識所決定的某些均數問的比較.常見於證實性研究中多個處理組與對照組、施加處理後的不同時間點與處理前比較。最初的設計方案不同.對應選擇的檢驗方法也不同. 下面分述兩種不同設計均數兩兩比較的方法選擇。

1. 事先計劃好的某對或某幾對均數間的比較

適用於證實性研究。在設計時就設定了要比較的組別,其他組別間不必作比較。常用的方法有: Dunnett-t 檢驗 、LSD-t 檢驗 (Fisher ’s least significant difference t test) 。這兩種方法不管方差分析的結果如何——即便對於 P稍大於檢驗水平α進行所關心組別間的比較。

1.1 LSD-t檢驗即最小顯著法

Fisher於1935年提出的, 多用於檢驗某一對或某幾對在專業上有特殊探索價值的均數間的兩兩比較,並且在多組均數的方差分析沒有推翻無效假設H0時也可以應用。該方法實質上就是 t檢驗, 檢驗水準無需作任何修正,只是在標準誤的計算上充分利用了樣本資訊,為所有的均數統一估計出一個更為穩健的標準誤, 因此它一般用於事先就已經明確所要實施對比的具體組別的多重比較

。由於該方法本質思想與 t 檢驗相同, 所以只適用於兩個相互獨立的樣本均數的比較。LSD法單次比較的檢驗水準仍為α , 因此可以認為該方法是最為靈敏的兩兩比較方法.另一 方面,由於LSD法側重於減少第Ⅱ類錯誤, 勢必導致此法在突出組間差異的同時,有增大I類錯誤的傾向。

1.2 Dunnett-t(新復極差法)檢驗

Duncan 1955年在Newman及Keuls的復極差法(muhiple range method)基礎上提出,該方法與Tukey法相類似。適用於n-1個試驗組與一個對照組均數差別的多重比較,多用於證實性研究。 Dunnett-t統計量的計算公式與LSD-t檢驗完全相同。

實驗組和對照組的樣本均數和樣本含量。需特別指出的是Dunnett—t檢驗有專門的界值表,不同於t檢驗的界值表 。

一般認為,比較組數k≥3時,任何兩個樣本的平均數比較會牽連到其它平均數的對比關係,而使比較數再也不是兩個相互獨立的樣本均數的比較.這是LSD-t無法克服的缺點。Dunnett—t針對這一問題提出.在同一顯著水平上兩個均數的最小顯著差數隨著這二個平均數在多個平均數中所佔的極差大小而不同,根據不同平均數間的對比關係來調整相應的顯著差別(critical range)的大小。

2. 多個均數的兩兩事後比較

適用於探索性研究,即各處理組兩兩問的對比關係都要回答,一般要將各組均數進行兩兩組合,分進行檢驗。常用的方法有:SNK-q(Student-Newman-Keuls q)法、Duncan法、Tukey法和Scheffe法。值得注意的是,這幾種方法對資料有具體的要求和限制。而文獻中我最常見的是Tukey法與SNK-q法,。

2.1 SNK-q檢驗

對於SNK-q檢驗,檢驗的統計量是q,所以又稱為q檢驗。SNK-q檢驗的原理是根據所包含不同數目的平均數的極差調整各自的顯著性水準,限制了實驗的誤差.保證在做所有比較時,不易犯第1類錯誤。

2.2 Tukey法

Tukey法(Tukey’S Honestly Significant Diference Tukey’s HSD)的原理與SNK-q檢驗基本相同,但是,該方法要求各比較組樣本含量相同 ,它將所有對比組中I類錯誤最大者控制在α之內。

研究顯示:這種方法有較高的檢驗效能(與LSD法比較),具有很好的穩定性,適用於大多數場合下的兩兩比較,計算簡便。但是,Tukey法是基於比較組全部參與比較這一假設下進行的,因此在只比較指定的某幾組總體均數時並不適用,建議選擇Dunnett法或者是Bonferroni方法,因為這兩種方法會給出較高效能的檢驗結果。

2.3 Scheffe法

與一般的多重比較不同,Scheffe法的實質是對多組均數間的線性組合是否為0進行假設檢驗,多用於對比組樣本含量不等的資料。在單因素的多重比較問題中,除了要逐對比較因素水平的平均效應之外,有時還有可能要比較因素水平平均效應的線性組合。例如將有基本相同的因素水平平均效應的幾個組,構成一個綜合組。因此可能檢驗這樣的假設:

顯然,前面討論的引數的兩兩比較屬於一類特殊的對比。Scheffe法可以同時檢驗所有可能的對比,即同時檢驗任何一組對比。Scheffe法的優點是可以檢驗任意的線性對比。在這方面,Tukey法不如Scheffe法。但是在單純作逐對因素效應均值的比較時,Schefe法的效率不如Tukey法高。也就是說,Schefe法更易於將顯著的差異判定為不顯著(Tukey法認為)。在實際場合,當單純作逐對均值

比較時,建議用Tukey法;而當要做多個一般的線性對比檢驗時。就要用Scheffe法。

Scheffe法檢驗實質上對F值進行了簡單的校正,將比較的組數納入考慮的範疇,該方法的檢驗統計量代表了最大可能的累積I類錯誤的概率。遺憾的是,由於控制I類錯誤時的“矯枉過正”.會最終導致較大的Ⅱ類錯誤的概率。

3. 探索性研究和證實性研究均適用的檢驗方法

3.1 Bonferroni t檢驗

基本思想是:如果三個樣本均數經ANOVA檢驗差異有統計學意義=0.05),需對每兩個均數進行比較,共需比較的次數為3次,由於每進行一次比較犯I類錯誤的概率是α=0.05,那麼比較3次至少有一次犯I類錯誤的概率就是:α’=1-0.9530.1426>0.05。因此,要使多次比較犯I類錯誤的概率不大於原檢驗水準α,現有的檢驗水準應該進行調整,用α’/m作為檢驗水準的調整值,兩兩比較得出的P值與其進行比較。該方法的思想適用於所有的兩兩比較,並且該方法的適用範圍很廣,不僅僅限於方差分析,例如相關係數的檢驗和卡方檢驗也適用。Bonferroni t檢驗的方法和思想容易理解,操作簡便,但是嚴格地控制了I類錯誤的同時增大了Ⅱ類錯誤的發生概率,在結論的給出方面是一種比較保守的方法。

3.2 Sidak檢驗

該方法通過Sidak校正降低每次兩兩比較的I類錯誤概率,以達到最終整個比較的I類錯誤發生率不超過α的目的。

Bonferroni t檢驗與Sidak檢驗相似,Bon.ferroni t檢驗是檢驗的近似計算,但是由於Bonferroni t檢驗在計算上容易實現,所以應用較廣。相比較而言,Bonferroni t檢驗在給出推斷結論時更為審慎。不容易得到拒絕零假設的結果。兩種檢驗在對比組數增加、比較組不獨立時,推斷結論更趨保守。

以上方法都必須在滿足方差齊性的前提條件時才可以應用,另外還有一些方法是在不滿足方差齊性時多重比較的方法:Tamhane’s T2,Dunnetts’s T3, Games-Howell, Games-Howell。

3.3Tamhane’s T2

是一種基於t檢驗原理的兩兩比較方法。該方法比較保守。

3.4Dunnetts’s T3

則是以最大的t值(studentized maximum modulus)為基礎的。

3.5Games-Howell檢驗方法

是比較寬大的一種兩兩比較方法。Games-Howell 方法將方差不齊的組數作為一個影響因素納入考慮範疇。嚴重的方差不齊和樣本含量過小都會使I類錯誤的概率增加。Games-Howell檢驗基於Welch’s對t檢驗的自由度進行校正,並使用了學生化極差作為統計量。該檢驗適用於樣本含量小且方差不齊(輕度方差不齊例外)時的情況。該方法是方差不齊時的一種較好的方法。

3.6Dunnett’s

是一種基於學生化極差的適用於方差不齊情況時兩兩比較的方法。

下圖是進行方差分析的流程圖

clip_image001[4]