1. 程式人生 > >幾種分佈概述(正態分佈/卡方分佈/F分佈/T分佈)

幾種分佈概述(正態分佈/卡方分佈/F分佈/T分佈)

       搞清楚了下面的幾種分佈,在置信區間估計、顯著性檢驗等問題中就會收到事半功倍的效果。come on~!

       正態分佈:正態分佈(Normal distribution)又名高斯分佈(Gaussiandistribution),若隨機變數X服從一個數學期望為μ、方差為σ^2的高斯分佈,記為N(μ,σ^2)。其概率密度函式為正態分佈的期望值μ決定了其位置,其標準差σ決定了分佈的幅度。我們通常所說的標準正態分佈是μ = 0,σ = 1的正態分佈。

       當μ=0,σ=1時,正態分佈就成為標準正態分佈N(0,1)。概率密度函式為:


1.png


       正態分佈的密度函式的特點是:關於μ對稱,並在μ處取最大值,在正(負)無窮遠處取值為0,在μ±σ處有拐點,形狀呈現中間高兩邊低,影象是一條位於x軸上方的鐘形曲線。

      卡方分佈:若n個相互獨立的隨機變數ξ₁、ξ₂、……、ξn ,均服從標準正態分佈N(0,1)(也稱獨立同分佈於標準正態分佈),則這n個服從標準正態分佈的隨機變數的平方和 2.png

構成一新的隨機變數,其分佈規律稱為3.png 分佈(chi-squaredistribution)。其中引數n稱為自由度(通俗講,樣本中獨立或能自由變化的自變數的個數,稱為自由度),正如正態分佈中均值或方差不同就是另一個正態分佈一樣,自由度不同就是另一個分佈。記為4.png 分佈的均值為自由度 n,記為 E() = n;分佈的方差為2倍的自由度(2n),記為 D() = 2n。

7.png


       從分佈圖可以看出:分佈在第一象限內,卡方值都是正值,呈正偏態(右偏態),隨著引數 n 的增大;

分佈趨近於正態分佈;隨著自由度n的增大,分佈向正無窮方向延伸(因為均值n越來越大),分佈曲線也越來越低闊(因為方差2n越來越大)。

       t分佈:首先要提一句u分佈,正態分佈(normal distribution)是許多統計方法的理論基礎。正態分佈的兩個引數μ和σ決定了正態分佈的位置和形態。為了應用方便,常將一般的正態變數X通過u變換[(X-μ)/σ]轉化成標準正態變數u,以使原來各種形態的正態分佈都轉換為μ=0,σ=1的標準正態分佈(standard normaldistribution),亦稱u分佈。根據中心極限定理,通過抽樣模擬試驗表明,在正態分佈總體中以固定 n 抽取若干個樣本時,樣本均數

的分佈仍服從正態分佈,即N(μ,σ)。所以,對樣本均數的分佈進行u變換,也可變換為標準正態分佈N (0,1)

       由於在實際工作中,往往σ(總體方差)是未知的,常用s(樣本方差)作為σ的估計值,為了與u變換區別,稱為t變換,統計量t 值的分佈稱為t分佈。假設X服從標準正態分佈N(0,1),Y服從(n)分佈,那麼Z=X/sqrt(Y/n)的分佈稱為自由度為n的t分佈,記為 Z~t(n)。

5.png


      可以看出,t分佈以0為中心,左右對稱的單峰分佈;t分佈是一簇曲線,其形態變化與n(確切地說與自由度ν)大小有關。自由度ν越小,t分佈曲線越低平;自由度ν越大,t分佈曲線越接近標準正態分佈(u分佈)曲線。

       F分佈:設X、Y為兩個獨立的隨機變數,X服從自由度為n的分佈,Y服從自由度為m的分佈,這兩個獨立的卡方分佈除以各自的自由度以後的比率服從F分佈。即:

6.png


      F分佈是一種非對稱分佈;它有兩個自由度,即n-1和m-1,相應的分佈記為F( n–1,m-1), n-1通常稱為分子自由度, m-1通常稱為分母自由度;F分佈是一個以自由度(n-1)和(m-1)為引數的分佈族,不同的自由度決定了F 分佈的形狀。