正態分佈(Normal Distribution)
正態分佈的基本描述:
在概率論裡面,正態分佈(或者叫高斯分佈)是非常常見的連續概率分佈。由於存在中心極限定理,這使得正態分佈十分有用。中心極限定理表明,在觀測資料非常大的時候,具有獨立分佈的獨立隨機變數的觀測樣本的平均值是收斂於正態分佈的。正態分佈的概率密度函式為:
這裡μ是分佈的均值,或者叫期望值;σ是標準差;σ的平方是方差。
另外,一個具有高斯分佈的隨機變數也被稱為是具有正態分佈的,這個變數被稱為正態偏差。
標準正態分佈:
當μ=0和σ=1的時候,正態分佈就是標準正態分佈了。標準正態分佈的概率密度函式如下:
標準正態分佈是關於x=0對稱的,並且在x=0的時候獲得最大值
通用正態分佈:
每一個正態分佈都可以看成是由標準正態分佈轉化而成的,通過將標準正態分佈的定義域先使用標準差σ進行拉伸,然後再平移μ個單位得到。公式如下。
假定Z是一個標準的正態偏差,X=σZ+μ也是具有正態分佈的正態偏差,X的期望值為μ,標準差為σ。相反的,如果X是一個期望值為μ、標準差為σ的正態偏差的話,那麼通過轉換Z=( X - μ ) / σ會得到一個標準正態分佈,得到的變數Z也可以叫做X的標準形式。
另外,每一個正態分佈都可以寫成以二次函式為自然常數的指數的形式。
這裡且。在這種形式下,正態分佈的均值為
正態分佈的表示符號:
正態分佈經常可以用和表示。因此,當一個隨機變數X是一個均值為μ和標準差為σ的正態偏差時,我們可以用這個形式表達:。
正態分佈的屬性:
①正態分佈是關於x = μ對稱的。
②正態分佈曲線有兩個拐點,分別在離均值一個標準差的位置,為x=μ-σ和x=μ+σ。
③對於任意的正態偏差X,Z = ( X - μ ) / σ是一個標準正態偏差。
④對於特定的期望值和方差,正態分佈是具有最大熵的連續分佈。
⑤由於對於離期望值好幾個標準差範圍之外的取值,它們的概率趨近於0。
⑥正態分佈概率的覆蓋範圍遵循68-95-99.7的規定,這個規定又稱為3-sigma規定。也就是說在距離均值一個標準差的範圍內的取值的概率大概是68%,在兩個標準差範圍大概是95,在三個標準差範圍大概是99.7%。
正態偏差上的操作:
①對正態偏差進行線性變換得到的也是正態偏差,如Y = aX + b,當X具有正態分佈時,Y也具有正態分佈。當X的期望值為μ,標準差為σ的時候,Y的期望值為aμ+b,標準差為|a|*σ。
②當X1和X2為兩個獨立的具有正態分佈的隨機變數時,如果它們的期望值分別是μ1和μ2,標準差為σ1和σ2,那麼X1+X2也是具有正態分佈的,對應的期望值為μ1+μ2,方差為σ1的平方加σ2的平方。
③獨立正態偏差的線性組合也是一個正態偏差。
④無限可分性:對於任意正整數n,任意均值為μ和標準差為σ的正態分佈都是n個獨立正態偏差的和,每一個正態偏差均值為μ/n和方差為σ的平方除以n。
⑤Cramer分解定理:如果X1和X2都是獨立隨機變數且他們的和滿足滿足正態分佈的話,那麼,X1和X2一定是正態偏差。換句話說就是,當且僅當兩個分佈是正態分佈時它們的卷積才是正態分佈。
⑥Bernstein‘s定理:如果X和Y是獨立的並且X+Y和X-Y也是獨立的,那麼X和Y都必須是滿足正態分佈的。