連續型概率分佈——正態分佈(一維)
今天想總結一下正太分佈,但是如果按照維基百科上面的講法,就太過複雜了,所以這裡著重講正態分佈在實際生活中的作用以及簡單的計算方法,也就是高中所學過的關於正態分佈的知識。
在正式開始之前,還是把維基百科上面的科普拎出來過一遍
正態分佈又名高斯分佈,是一個在數學、物理及工程等領域都非常重要的概率分佈,在統計學的許多方面有著重大的影響力。
1. 正態分佈的定義
如果對於任何實數a<b,隨機變數X滿足:
則稱X的分佈為正態分佈。
正態分佈由引數μ、σ唯一確定,μ、σ分別表示總體的平均數和標準差。正太分佈記作N(μ, σ²). 其中影象稱為正太曲線。
如果隨機變數X服從正態分佈,則記作:
X~N(μ, σ²)。(EX=μ DX=σ)
2. 正態曲線的性質
具有兩頭低、中間高、左右對稱的基本特徵。
(1)曲線在x軸的上方,與x軸不相交。
(2)曲線是單峰的,它關於直線x=μ對稱。
(3)曲線在x=μ處達到峰值。
(4)曲線與x軸之間的面積為1.
(5)方差相等、平均數不等的正態分佈圖示
(6)平均數相等、方差不等的正態分佈圖示
σ越大,曲線越“矮胖”,表示總體的分佈越分散;
σ越小,曲線越“瘦高”,表示總體的分佈越集中。
(7)正態曲線下的概率規律(*)
- 對稱區域面積相等
3. 特殊區間的概率:
若X~N(μ, σ²),則對於任何實數a>0, 概率
特別地有(熟記)
我們從上圖看到,正態總體在(μ-2σ,μ+2σ)以外取值的概率只有4.6%,在(μ-3σ, μ+3σ)以外取值的概率只有0.3%。
由於這些概率值很小(一般不超過5%),通常稱這些情況發生為小概率時間。
實際運用中就只考慮這個區間,稱為3σ原則。
4. 應用舉例
例1: 若X~N(5,1), 求P(6<X<7)。
解:μ=5,σ=1
正態總體在(3,7)的區間內取值的概率為0.954
正態總體在(4,6)區間內取值的概率為0.683
P(6<X<7) = (0.954-0.683)/2 = 0.1355
例2:在某次數學考試中,考生的成績ξ服從一個正態分佈,及ξ~N(90,100)。
(1)試求考試成績ξ位於區間(70,110)上的概率是多少? 0.954
(2)若這次考試共有2000名考生,試估計考試成績在(80,100)見的考生大約有多少人?
解: 0.683*2000 = 1366
這裡主要講的是一維正態分佈,接下來會講一下二維正態分佈。