1. 程式人生 > >協方差(Covariance)

協方差(Covariance)

統計學上用方差和標準差來度量資料的離散程度 ,但是方差和標準差是用來描述一維資料的(或者說是多維資料的一個維度),現實生活中我們常常會碰到多維資料,因此人們發明了協方差(covariance),用來度量兩個隨機變數之間的關係。

 

我們仿照方差的公式來定義協方差:

方差: 關於協方差矩陣的概念及意義

協方差: 關於協方差矩陣的概念及意義

(注:因為這裡是計算樣本的方差,因此用n-1。之所以除以n-1而不是除以n,是因為這樣能使我們以較小的樣本集更好地逼近總體,即統計上所謂的“無偏估計”。)

 

協方差如果為正值,說明兩個變數的變化趨勢一致;如果為負值, 說明兩個變數的變化趨勢相反;如果為0,則兩個變數

之間不相關(注:協方差為0不代表這兩個變數相互獨立。不相關是指兩個隨機變數之間沒有近似的線性關係,而獨立是指兩個變數之間沒有任何關係)

 

但是協方差也只能處理二維問題,如果有n個變數X1、X2、···Xn,那怎麼表示這些變數之間的關係呢?解決辦法就是把它們兩兩之間的協方差組成協方差矩陣(covariance matrix)

 

協方差矩陣是這樣來定義的:

 

如果有n個變數:

 

那麼上述n個變數的協方差矩陣就是:

 

其中,