1. 程式人生 > >Pearson,Kendall和Spearman三種相關分析方法的異同

Pearson,Kendall和Spearman三種相關分析方法的異同

pearson(皮爾遜), kendall(肯德爾)和spearman(斯伯曼/斯皮爾曼)三種相關分析方法有什麼異同
 兩個連續變數間呈線性相關時,使用Pearson積差相關係數,不滿足積差相關分析的適用條件時,使用Spearman秩相關係數來描述.
 Spearman相關係數又稱秩相關係數,是利用兩變數的秩次大小作線性相關分析,對原始變數的分佈不作要求,屬於非引數統計方法,適用範圍要廣些。對於服從Pearson相關係數的資料亦可計算Spearman相關係數,但統計效能要低一些。Pearson相關係數的計算公式可以完全套用Spearman相關係數計算公式,但公式中的x和y用相應的秩次代替即可。
 Kendall's tau-b等級相關係數:用於反映分類變數相關性的指標,適用於兩個分類變數均為有序分類的情況。對相關的有序變數進行非引數相關檢驗;取值範圍在-1-1之間,此檢驗適合於正方形表格;

 計算積距pearson相關係數,連續性變數才可採用;計算Spearman秩相關係數,適合於定序變數或不滿足正態分佈假設的等間隔資料; 計算Kendall秩相關係數,適合於定序變數或不滿足正態分佈假設的等間隔資料。
 計算相關係數:當資料不服從雙變數正態分佈或總體分佈未知,或原始資料用等級表示時,宜用 spearman或kendall相關
Pearson 相關複選項 積差相關計算連續變數或是等間距測度的變數間的相關分析 
Kendall  複選項 等級相關 計算分類變數間的秩相關,適用於合併等級資料
 Spearman  複選項 等級相關計算斯皮爾曼相關,適用於連續等級資料
注:
1若非等間距測度的連續變數 因為分佈不明-可用等級相關/也可用
Pearson 相關,對於完全等級離散變數必用等級相關
2當資料不服從雙變數正態分佈或總體分佈型未知或原始資料是用等級表示時,宜用 Spearman 或 Kendall相關。
3 若不恰當用了Kendall 等級相關分析則可能得出相關係數偏小的結論。則若不恰當使用,可能得相關係數偏小或偏大結論而考察不到不同變數間存在的密切關係。對一般情況預設資料服從正態分佈的,故用Pearson分析方法。

在SPSS裡進入Correlate-》Bivariate,在變數下面Correlation Coefficients複選框組裡有3個選項:
    Pearson
    Kendall's tau-b
    Spearman:Spearman

spearman(斯伯曼/斯皮爾曼)相關係數
      斯皮爾曼等級相關是根據等級資料研究兩個變數間相關關係的方法。它是依據兩列成對等級的各對等級數之差來進行計算的,所以又稱為“等級差數法”
      斯皮爾曼等級相關對資料條件的要求沒有積差相關係數嚴格,只要兩個變數的觀測值是成對的等級評定資料,或者是由連續變數觀測資料轉化得到的等級資料,不論兩個變數的總體分佈形態、樣本容量的大小如何,都可以用斯皮爾曼等級相關來進行研究。

Kendall's相關係數
      肯德爾(Kendall)W係數又稱和諧係數,是表示多列等級變數相關程度的一種方法。適用這種方法的資料資料一般是採用等級評定的方法收集的,即讓K個評委(被試)評定N件事物,或1個評委(被試)先後K次評定N件事物。等級評定法每個評價者對N件事物排出一個等級順序,最小的等級序數為1 ,最大的為N,若並列等級時,則平分共同應該佔據的等級,如,平時所說的兩個並列第一名,他們應該佔據1,2名,所以它們的等級應是1.5,又如一個第一名,兩個並列第二名,三個並列第三名,則它們對應的等級應該是1,2.5,2.5,5,5,5,這裡2.5是2,3的平均,5是4,5,6的平均。

      肯德爾(Kendall)U係數又稱一致性係數,是表示多列等級變數相關程度的一種方法。該方法同樣適用於讓K個評委(被試)評定N件事物,或1個評委(被試)先後K次評定N件事物所得的資料資料,只不過評定時採用對偶評定的方法,即每一次評定都要將N個事物兩兩比較,評定結果如下表所示,表格中空白位(陰影部分可以不管)填入的資料為:若i比j好記1,若i比j差記0,兩者相同則記0.5。一共將得到K張這樣的表格,將這K張表格重疊起來,對應位置的資料累加起來作為最後進行計算的資料,這些資料記為γij。

正態分佈的相關檢驗
       對來自正態總體的兩個樣本進行均值比較常使用T檢驗的方法。T檢驗要求兩個被比較的樣本來自正態總體。兩個樣本方差相等與不等時用的計算T值的公式不同。
      進行方差齊次性檢驗使用F檢驗。對應的零假設是:兩組樣本方差相等。P值小於0.05說明在該水平上否定原假設,方差不齊;否則兩組方差無顯著性差異。
      U檢驗時用服從正態分佈的檢驗量去檢驗總體均值差異情況的方法。在這種情況下總體方差通常是已知的。
      雖然T檢驗法與U檢驗法所解決的問題大體相同,但在小樣本(樣本數n)=30作為大樣本)且均方差未知的情況下就不能用U檢驗法了。
      均值檢驗時不同的資料使用不同的統計量
      使用MEANS過程求若干組的描述統計量,目的在於比較。因此必須分組求均值。這是與Descriptives過程不同之處。
      檢驗單個變數的均值是否與給定的常數之間存在差異,用One-Sample T Test 單樣本T檢驗過程。
      檢驗兩個不相關的樣本是否來自來具有相同均值的總體,用Independent-Samples T test 獨立樣本t檢驗過程。
      如果分組樣本不獨立,用Paired Sample T test 配對t檢驗。
      如果分組不止兩個,應使用One-Way ANOVO一元方差分析(用於檢驗幾個獨立的組,是否來自均值相等的總體)過程進行單變數方差分析。
     如果試圖比較的變數明顯不服從正態分佈,則應該考慮使用一種非引數檢驗過程Nonparametric test.
     如果使用者相比較的變數是分類變數,應該使用Crosstabs功能。
     當樣本值不能為負值時用右側單邊檢驗。