統計學三大相關係數之Pearson相關係數、Spearman相關係數
- 相關係數 :考察兩個變數之間的相關程度。相關係數的取值範圍是-1到1,絕對值越接近1,則說明兩個變數之間的相關程度越大;絕對值越接近0,則說明兩個變數之間的相關程度越小,具體見下圖:
二、Pearson相關係數:
-
1.先給出公式推導:
-
①首先由Pearson相關係數的定義可知,
-
②這裡,分子cov表示協方差,分母表示標準差(以兩個變數為例):
- ③代入即可消得Pearson相關係數計算公式為:
-
-
2.Pearson相關係數可用於衡量變數之間的線性相關程度,但有一定的使用條件:
三、Spearman相關係數
-
1.總的來說,Spearman相關係數的計算方法和Pearson相關係數是一樣的,只是計算用特徵的等級取代特徵的真實值。例如,給定三個值:30,50,10,它們的等級就分別是2,3,1,則計算時用2,3,1這幾個等級代替30,50,10這些本身的值
-
2.照例,先給出公式(兩種):
-
公式一:
-
公式二:
-
-
3.適用範圍:
- ①相對於皮爾森相關係數,斯皮爾曼相關係數 對於資料錯誤和極端值的反應不敏感 。
- ②斯皮爾曼等級相關係數對資料條件的要求沒有皮爾遜相關係數嚴格,只要兩個變數的觀測值是成對的等級評定資料,或者是由連續變數觀測資料轉化得到的等級資料, 不論兩個變數的總體分佈形態、樣本容量的大小如何 ,都可以用斯皮爾曼等級相關係數來進行研究。