期望、方差、協方差及相關係數的原理理解和計算
阿新 • • 發佈:2019-02-08
一、期望
定義:
設P(x)是一個離散概率分佈函式自變數的取值範圍是。那麼其期望被定義為: 設P(x)是一個連續概率分佈函式 ,那麼他的期望是:性質:
1.線性運算:
期望服從先行性質,因此線性運算的期望等於期望的線性運算:2.函式的期望:
設f(x)是x的函式,則f(x)的期望為:
離散:
連續:
3.乘積的期望:
一般來說,乘積的期望不等於期望的乘積,除非變數相互獨立。因此,如果x和y相互獨立,則
期望的運算構成了統計量的運算基礎,因為方差、協方差等統計量本質上是一種特殊的期望。
設C為一個常數,X和Y是兩個例子:
某城市有10萬個家庭,沒有孩子的家庭有1000個,有一個孩子的家庭有9萬個,有兩個孩子的家庭有6000個,有3個孩子的家庭有3000個。求一個家庭平均小孩的數目: 思路:則此城市中任一個家庭中孩子的數目是一個隨機變數。它可取值0,1,2,3。其中取0的概率為0.01(1000/10萬),取1的概率0.9(9000/10萬),取2的概率為0.06(6000/10萬),取3的概率為0.03(3000/10萬)。二、方差
定義:
方差是一種特殊的期望,被定義為:
離散型的方差:
連續型的方差:
性質:
1.設C是常數,則D(C)=0 2.設X是隨機變數,C是常數,則有 3.設 X 與 Y 是兩個隨機變數,則 其中協方差 特別的,當X,Y是兩個不相關的隨機變數(相互獨立)則 此性質可以推廣到有限多個兩兩不相關的隨機變數之和的情況。統計學意義:
方差和標準差是測算離散趨勢最重要、最常用的指標。方差是各變數值與其均值離差平方的平均數,它是測算數值型資料離散程度的最重要的方法。標準差為方差的算術平方根,用S表示。方差相應的計算公式為(無偏性)。 標準差與方差不同的是,標準差和變數的計算單位相同,比方差清楚,因此很多時候我們分析的時候更多的使用的是標準差。三、協方差
定義:
在概率論和統計學中,協方差用於衡量兩個變數的總體誤差。期望值分別為E[X]與E[Y]的兩個實隨機變數X與Y之間的協方差Cov(X,Y)定義為:特殊情況下,當X=Y時: