1. 程式人生 > >詳解幾個基本概念“標準差&標準誤差,方差&均方差”

詳解幾個基本概念“標準差&標準誤差,方差&均方差”

對於從事資料工作的人來說,經常需要用到方差、標準差、均方差等概念,但即使是一個數學專業的畢業生(比如我自己),經常也會被這幾個概念弄得頭暈腦脹,使用的時候也是清楚的少,碰運氣的多。
這裡,我通俗易懂的把這幾個概念總結歸納一下,力爭弄得清楚,用得明白。

方差(variance)

方差是用來衡量一組資料離散程度的統計量。

σ2=1nin(xix¯)2其中xi為第i個數據,x¯xi的平均數。

標準差=均方差

標準差(standard deviation)等同於均方差(mean square error, MSE)。standard deviation英文譯為“標準偏離”,事實上,標準差計算一組資料偏離均值的平均幅度,不管這組資料是樣本資料還是總體資料。標準差的計算公式為:

σ=1nin(xix¯)2其中xi為每個資料點,x¯xi的平均數。
標準差是方差的平方根。

標準差&標準誤差

標準差和標準誤差往往很難區分。
標準誤差(standard error,SE)體現使用樣本統計量估計總體引數時的一種估計精度
但是,總體引數往往是不可估計的,因此經常使用樣本標準差s來估計總體標準誤差σ
標準誤差估算值為:

σ=1n1in(xix¯)2其中xi為每個資料點,x¯xi的平均數。

標準差表示資料之間差異大小,也即資料精密度的度量,標準誤差表示樣本平均數和總體平均數的變異程度,可以用來反映結果精密度