1. 程式人生 > >統計學學習筆記:(三)隨機變數、概率密度、二項分佈、期望值

統計學學習筆記:(三)隨機變數、概率密度、二項分佈、期望值

隨機變數 Random Variable

隨機變數和一般資料上的變數不一樣,通常用大寫字母表示,如X、Y、Z,不是個引數而是function,即函式。例如,下面表示明天是否下雨的隨機變數X,如下。又例如X=每小時經過路口的車輛,隨機變數是個描述,而不是方程中的變數。

隨機變數有兩種,一種是離散的(discrete),一種是連續的(continue)。離散的如上面例子是可以列舉,而連續的隨機變數的取值是infinite的。

概率密度函式

概率probability,以roll dice為例,P(X=6)=1/6,P(X>=5)=1/3,即6點的骰子概率為1/6,大於等於5點的骰子概率為1/3。這是離散的概率例子。


對於連續的,例如明天雨量。使用的是probability density function,下圖是個分佈例子。

P(X=2)是多少,0.5嗎?不對。精確雨量要2.00000……,概率為0。對於連續隨機變數,概率的統計是一個範圍,例如P(|X-2|<0.3),相當於計算area。以f(x)表示隨機variable,則為

二項分佈

二項分佈binomial distribution,有個更熟悉的名字normal distribution正態分佈。隨機變數處於兩種狀態,例如硬幣的正面或反面,投籃投中或者miss。如果是公平隨機,例如拋硬幣,每個狀態出現的機率是0.5。對於投籃,可能是P(shoot)=0.7,P(miss)=0.3。

如何計算P(X=n),n為出現某種狀態的次數。假設一共投籃N次籃(N=6),有多少種可能組合,例如出現2次命中的組合。簡單說我們有A、B兩個字母,填入6個空格,可以有多少種組合。為6×5,如果有A、B、C三個字母,則有6×5×4,即N!/(N-n)!

由於在計算概率中,A和B的先後順序沒有影響,即無先後順序,則還要除以n!(A、B或A、B、C本身的排列組合),在組合中表述為:

我們得到了組合次數,每個組合出現的概率是多少?投6中2為P(shoot)p(shoot)p(miss)p(miss)p(miss)p(miss),將每個位置出現的概率乘前來就可以,即p^n×(1-p)^(N-n),總的概率為:

其實倒不需要去死記硬背,只要知曉計算原理,很容易推導。

這些概率非常適合在Excel中進行計算和畫圖。在Excel有個小技巧我一直不會,如果固定選某個單元,選擇後用F4,在copy這個公式的時候,就不會飄移位置。

期望值E(X)

期望值Exptected value of a random varaible,實際就是population mean,有些時候總本是infinite,例如無數次仍投硬幣的結果,可通過頻率×數值求和獲得。

二項分佈的E(X)

如果是二項分佈,n表示次數,則E(X)=np,這個推導過程很有趣

二項分佈的variance(方差)

和期望值一樣,這屬於頭腦體操,其基本方式亦也差不多。將證明方差為np(1-p)。這部分不是Khan公開課,講正態分佈時涉及二項式方差的計算公式,興致來了,玩一下。