1. 程式人生 > >連續型概率分佈——正態分佈(一維)

連續型概率分佈——正態分佈(一維)

今天想總結一下正太分佈,但是如果按照維基百科上面的講法,就太過複雜了,所以這裡著重講正態分佈在實際生活中的作用以及簡單的計算方法,也就是高中所學過的關於正態分佈的知識。

在正式開始之前,還是把維基百科上面的科普拎出來過一遍

正態分佈又名高斯分佈,是一個在數學、物理及工程等領域都非常重要的概率分佈,在統計學的許多方面有著重大的影響力。

1. 正態分佈的定義

如果對於任何實數a<b,隨機變數X滿足:

      

則稱X的分佈為正態分佈。


正態分佈由引數μ、σ唯一確定,μ、σ分別表示總體的平均數和標準差。正太分佈記作N(μ, σ²). 其中影象稱為正太曲線。

如果隨機變數X服從正態分佈,則記作:

X~N(μ, σ²)。(EX=μ  DX=σ)

2. 正態曲線的性質

具有兩頭低、中間高、左右對稱的基本特徵

(1)曲線在x軸的上方,與x軸不相交。

(2)曲線是單峰的,它關於直線x=μ對稱。

(3)曲線在x=μ處達到峰值

(4)曲線與x軸之間的面積為1.

(5)方差相等、平均數不等的正態分佈圖示


(6)平均數相等、方差不等的正態分佈圖示

σ越大,曲線越“矮胖”,表示總體的分佈越分散;

σ越小,曲線越“瘦高”,表示總體的分佈越集中。

(7)正態曲線下的概率規律(*)

  • 對稱區域面積相等

3. 特殊區間的概率:

若X~N(μ, σ²),則對於任何實數a>0, 概率

特別地有(熟記)

我們從上圖看到,正態總體在(μ-2σ,μ+2σ)以外取值的概率只有4.6%,在(μ-3σ, μ+3σ)以外取值的概率只有0.3%。

由於這些概率值很小(一般不超過5%),通常稱這些情況發生為小概率時間。

實際運用中就只考慮這個區間,稱為3σ原則。

4. 應用舉例

例1: 若X~N(5,1), 求P(6<X<7)。

解:μ=5,σ=1

      正態總體在(3,7)的區間內取值的概率為0.954

      正態總體在(4,6)區間內取值的概率為0.683

      P(6<X<7) = (0.954-0.683)/2 = 0.1355

例2:在某次數學考試中,考生的成績ξ服從一個正態分佈,及ξ~N(90,100)。

(1)試求考試成績ξ位於區間(70,110)上的概率是多少? 0.954

(2)若這次考試共有2000名考生,試估計考試成績在(80,100)見的考生大約有多少人?

      解: 0.683*2000 = 1366

這裡主要講的是一維正態分佈,接下來會講一下二維正態分佈。