1. 程式人生 > >統計學——單因素方差分析

統計學——單因素方差分析

概念

方差分析:又稱變異分析,是英國統計學家R.A.Fisher於1923年提出的一種統計方法,故有時也稱為F檢驗。

可簡寫為ANOVA。用於多組均數 之間的顯著性檢驗。

要求:各組觀察值服從正態分佈或近似正態分佈,並且各組之間的方差具有齊性

基本思想:將所有測量值間的總變異按照其變異的來源分解為多個部份,然後進行比較,評價由某種因素所引起的變異是否具有統計學意義。


計算方法

總變異(Total variation):全部測量值xij與總均數間μ的差異

組間變異( between group variation ):各組的均數μi與總均數μ間的差異

組內變異(within groupvariation ):每組的每個測量值xij

與該組均數μi的差異


其中,三種變異的關係為:SST = SSB + SSW,DT = DB+ DW


例題

有三組人,分別服用了不同的高血壓藥A,B,C一個月以後,觀察每一個人血壓下降數:

A組               4             5             7             3             8             5             3                                           μA= 5.00

B組               1             5             3             7             4             2             7             4             1             μB

= 3.78

C組               7             8             10           6             9             8                                                          μC= 8.00

我們想要知道A,B,C三個藥對於下降血壓的效果是否有明顯的區別。

解題

假設:

H0:A,B,C三個藥下降血壓效果沒有區別,即μA= μB= μC

H1:A,B,C三個藥下降血壓有區別

1. 首先我們需要求SST,SSB,SSW

求SST之前我們先需要求出A,B,C三組人的平均值:

μ = (xA1+xA2+…+xAn+xB1+xB2+…+xBn+xC1+xC2+…+xCn)

= (4+5+7+3+8+5+3+1+5+3+7+4+2+7+4+1+7+8+10+6+9+8)/22

= 5.32

所以SST = (xA1-μ)2+…+(xAn-μ)2+(xB1-μ)2…+(xBn-μ)2+(xC1-μ)2…+(xCn-μ)2

= (4-μ)2+…+(3 -μ)2+(1-μ)2…+(1-μ)2+(7-μ)2…+(8-μ)2

= 139

再求SSB = (μA -μ) 2+(μA-μ)2+( μA-μ)2+( μB-μ)2+( μB-μ)2+( μB-μ)2+( μC-μ)2+( μC-μ)2+( μC-μ)2=65.2

最後求

SSW = (xA1- μA)2+…+(xAn- μA)2+(xB1B)2…+(xBn- μB)2+(xC1C)2…+(xCn- μC)2

= (4-5.00)2+…+(3 -5.00)2+(1-3.78)2…+(1-3.78)2+(7-8.00)2…+(8 -8.00)2

= 73.6

根據性質SST = SSW + SSB,所以這三個只要求出其它兩個,另外一個用等式SST= SSW + SSB即可求出。

2. 我們求自由度:DT,DB,DW

我們知道樣本總共有22個,而且我們知道樣本總體的值,所以我們只需要知道其中21個樣本,剩下的1個就可以的出來,所以總體自由度DT= 22-1 = 21

因為我們有3組,我們只需要知道其中的兩組,另外一組也可以的出來,所以組間自由度DB= 3-2 = 2

第一組有7個樣本,我們只需要知道其中的6個,剩下的一個可以的出來,所以第一組的自由度DW1= (7-1) = 6,同理,第二三組的也可以的出來,所以總的組內自由度DW= (7-1) + (9-1) +(6-1) = 19

同理,我們有性質DT = DB + DW,所以我們只要知道其中兩個自由度,剩下的一個可以由公式得出。

3. 最後我們求F,F的公式為F = (SSB/DB) / (SSW/DW) =(65.2/2) / (73.6/19) = 8.42,且自由度為F(2,19)

此時我們α=0.05的F分佈表如下圖,我們看到自由度為2和19時,置信度為95%的值為3.55,而此時我們的值為8.42,遠超過3.55,所以我們接受H0的概率小於0.05,所以拒絕H0假設,接受H1,即A,B,C三個藥的效果有明顯的不同


R語言實現

anova = function(x){
  
  x_mean = sapply(x,mean)
  total_mean = mean(unlist(x))
  
  sst = sum((unlist(x)-total_mean)^2)
  
  ssw = 0
  for(i in 1:length(x)){
    w = sum((x[[i]]-x_mean[i])^2)
    ssw = ssw + w
  }
  
  ssb = 0
  for(i in 1:length(x)){
    b = length(x[[i]])*((x_mean[i]-total_mean)^2)
    ssb = ssb + b
  }
  
  Nt = length(unlist(x))-1 # 總自由度
  Nb = length(x)-1 # 組間自由度
  Nw = Nt - Nb 
  
  f = (ssb/Nb)/(ssw/Nw)
  
  result = c(sst,ssb,ssw,Nt,Nb,Nw,f)
  names(result)= c('sst','ssb','ssw','Nt','Nb','Nw','f')
  
  return(result)
  
}

x1 = c(4,5,7,3,8,5,3)
x2 = c(1,5,3,7,4,2,7,4,1)
x3 = c(7,8,10,6,9,8)
x = list(x1,x2,x3)

f = anova(x)

最後得出f為:


相關推薦

統計學——因素分析

概念 方差分析:又稱變異分析,是英國統計學家R.A.Fisher於1923年提出的一種統計方法,故有時也稱為F檢驗。 可簡寫為ANOVA。用於多組均數 之間的顯著性檢驗。 要求:各組觀察值服從正態分佈或近似正態分佈,並且各組之間的方差具有齊性。 基本思想:將所有測

python做因素分析

方差分析的主要功能就是驗證兩組樣本,或者兩組以上的樣本均值是否有顯著性差異,即均值是否一樣。 這裡有兩個大點需要注意:①方差分析的原假設是:樣本不存在顯著性差異(即,均值完全相等);②兩樣本資料無互動作用(即,樣本資料獨立)這一點在雙因素方差分析中判斷兩因素是否獨立時用。 原理: 方差分析的原理就一個方程:S

Kruskal-Wallis因子分析

如果你在進行多個群組之間比較時,因為群組不滿足正態分佈而不能使用ANOVA多比較,那麼你可以使用Kruskal-Wallis檢驗。該檢驗類似於前面兩個樣本的Wilcox檢驗。 假設你想看看以下4個數值集合的均值是否統計相似: Group A: 1, 5, 8, 17,

R語言中的雙因素分析

在雙因素方差分析中,受試者被分配到兩因子的交叉類別組中。以基礎安裝中的Tooth- Growth資料集為例,隨機分配60只豚鼠,分別採用兩種餵食方法(橙汁或維生素C),各餵食方法中抗壞血酸含量有三種水

Excel在統計分析中的應用—第十章—分析-有重複雙因素分析工具

“雙因素方差分析(Double factor/two-way variance analysis) 有兩種型別:一個是無互動作用的雙因素方差分析,它假定因素A和因素B的效應之間是相互獨立的,不存在相互關係;另一個是有互動作用的雙因素方差分析,它假定因素A和因素B的結合會產生

Covariance 協分析

images var .cn htm baidu ima tps 分析 ges PDF文檔 https://wenku.baidu.com/view/1ad38cacc850ad02df80415d.html Covariance 協方差分析

分析

分析法 tar 需要 strong tlab tla 不同類 工程 tro 前言 工程實現的過程中需要對提取的特征指標進行有效性分析,評價各個特征指標與不同類別的顯著性關系,篩選出對不同類別判別貢獻率最佳的指標,為設計分類器等提供支持。 本文主要針對單因子方差分析法。 實現

R語言-分析

評估 car 方差 bsp rac 一個 grey pla span 方差分析指的是不同變量之間互相影響從而導致結果的變化 1.單因素方差分析:   案例:50名患者接受降低膽固醇治療的藥物,其中三種治療條件使用藥物相同(20mg一天一次,10mg一天兩次,5mg一天四次)

ANOVA | 分析

href IE .com pap 現在 tps www 問題 使用 老早就看見過ANOVA這個單詞了,也沒去查是什麽意思,今天要用了,一百度居然是方差分析。 統計學基礎: 假設檢驗可以用於比較單組、兩組之間的均值和方差的差異,那到三組及以上怎麽辦?那就是方差分析了,最最

SPSS-分析

沒有 差異 基本概念 控制 src 研究 color ima 檢驗 方差分析(單因素方差分析、多因素方差分析、協方差分析) 基本概念:進行兩組以上均數的比較,檢驗兩個或兩個以上樣本均數差別的顯著性(T檢驗主要是檢驗兩個樣本均數差別的顯著性

SPSS協分析

1、分析原理 協方差分析是迴歸分析與方差分析的結合。在作兩組和多組均數之間的比較前,用直線迴歸的方法找出各組因變數Y與協變數X之間的數量關係,求得在假定X相等時的修正均數,然後用方差分析比較修正均數之間的差別。 要求X與Y的線性關係在各組均成立,且在各組間迴歸係數近似相等,即迴歸直線平行;X的取

SPSS-多元分析

SPSS之多變數方差分析 軟體:SPSS 23 單因素方差分析:如果方差不齊,就看Brown-Forsythe和Welch修正值 Analyze→General linear model→multivariate 多因素方差分析的其他

使用spss做分析

還記得上學那會老師專門敲了黑板,強調方差分析很重要。。單因素方差分析(Analysis of Variance, ANOVA),如果變數多,就是多因素方差分析,還需要考慮到多重共線性, 也就是線性代數裡的那些知識了。 現在寫paper,基本上要用兩種不同的方法做資料分析相互驗證。比如用R和SPSS或者SA

R教材7 分析

方差分析:組間差別分析aov(formula,data),將組別因子加入到函式 雙因素方差分析中,若不同的分組中組內觀測數不同則模型的順序具有唯一性;ANOVA模型的順序很重要,模型Y~A+B+A:B,其中Y為因變數,A,B為分組量 序貫型:後面對線出現的效應做調整,A

奇怪的分析結果:三方互動的pvalue 1

我執行一個三路互動,預測“判斷”從“factor_1”(主題,兩個水平),“factor_2”(主題,兩個水平)和factor_3(主題內,兩個級別)。 我有120名參與者在每個級別的factor_1和factor_2(30) model <- aov(judgment ~ factor_1facto

分析

ats 方式 col 選擇 因子 多個 學院 方差 方案 方差分析是研究一種或多種因素的變化對試驗結果的觀測值是否有顯著影響,從而找出較優的試驗條件或生產條件的一種數理統計方法。 方差分析按 影響分析指標 的因素(自變量)個數的多少 ,分為單因素、多因素方差分析

統計學---之樣本與總體的區別

前段日子重新整理了一下這個問題的解答,跟大家分享一下,如果有什麼錯誤的話希望大家能夠提出來,我會及時改正的,話不多說進入正題: 首先,我們來看一下樣本方差的計算公式:                 &nbs

one-way ANOVA(analysis of variance) 單向分析

問題描述:在比較兩組獨立正態分佈樣本的均值時用t test,那麼比較多組樣本的均值呢?要用one-way ANOVA。 Note: 使用ANOVA時,要假定k個組的方差相同。如果k個組的方差並不相同,就不應該使用ANOVA,要分別對兩組間用t檢驗。 當我們看到這種要同時比較多組樣本的

R語言開發之協分析瞭解下

我們通常使用迴歸分析來建立描述預測變數變數對響應變數的影響的模型,有時,如果我們有類似於是/否或男/女等值的分類變數,簡單迴歸分析為分類變數的每個值提供多個結果。在這種情況下,我們可以通過使用分類變數和預測變數來研究分類變數的影響,並比較分類變數的每個級別的迴歸線。 這樣的分

分析中均值比較的方法

轉載:http://blog.sina.com.cn/s/blog_5de124240101q55q.html 最近看文獻時,多數實驗結果用到方差分析,但選的方法不同,主要有LSD,SNK-q,TukeyHSD法等,從百度廣庫裡找了一篇文章,大概介紹這幾種方法,具體公式不列了,軟體都可以計算。這幾種方法主要