皮爾森相關係數演算法
阿新 • • 發佈:2018-11-12
皮爾森相關係數(Pearson correlation coefficient)也稱皮爾森積矩相關係數(Pearson product-moment correlation coefficient) ,是一種線性相關係數。皮爾森相關係數是用來反映兩個變數線性相關程度的統計量。相關係數用r表示,其中n為樣本量,分別為兩個變數的觀測值和均值。r描述的是兩個變數間線性相關強弱的程度。r的絕對值越大表明相關性越強。
定義:
兩個變數之間的皮爾遜相關係數定義為兩個變數之間的協方差和標準差的商:
上式定義了總體相關係數,常用希臘小寫字母 ρ (rho) 作為代表符號。估算樣本的協方差和標準差,可得到樣本相關係數(樣本皮爾遜係數),常用英文小寫字母 r 代表:
適用範圍
當兩個變數的標準差都不為零時,相關係數才有定義,皮爾遜相關係數適用於:
(1)兩個變數之間是線性關係,都是連續資料。
(2)兩個變數的總體是正態分佈,或接近正態的單峰分佈。
(3)兩個變數的觀測值是成對的,每對觀測值之間相互獨立。