1. 程式人生 > >伯努利分佈、二項分佈、幾何分佈、超幾何分佈、泊松分佈

伯努利分佈、二項分佈、幾何分佈、超幾何分佈、泊松分佈

導語
       對於任何一個學習概率論的童鞋來說,各種分佈都是很頭痛的一件事情,本篇主要討論的是離散型隨機變數.

伯努利分佈
       伯努利分佈就是我們常見的0-1分佈,即它的隨機變數只取0或者1,各自的頻率分別取1−p1−p和pp,當x=0x=0或者x=1x=1時,我們數學定義為: 
p(x)=px∗(1−p)1−x
p(x)=px∗(1−p)1−x

       其它情況下p(x)=0p(x)=0,伯努利分佈是一個非常好理解的分佈,也是很多其它分佈的基礎。
離散型隨機變數期望:E(x)=∑x∗p(x)E(x)=∑x∗p(x) 
方差:D(x)=E(x2)−E2(x)D(x)=E(x2)−E2(x)
       對於伯努利分佈來說,E(x)=1∗p+0∗(1−p)=p,D(x)=12∗p−p2=p(1−p)E(x)=1∗p+0∗(1−p)=p,D(x)=12∗p−p2=p(1−p)
二項分佈
       二項分佈是這樣一種分佈,假設進行n次獨立實驗,每次實驗“成功”的概率為pp,失敗的概率為1−p1−p,所有成功的次數XX就是一個引數為nn和pp的二項隨機變數.數學公式定義為: 
p(k)=(nk)∗pk∗(1−p)n−k
p(k)=(nk)∗pk∗(1−p)n−k

       二項分佈公式基於伯努利分佈得到,因為二項分佈中每項實驗都是獨立的,因此每一次實驗都是一次伯努利實驗,在nn次實驗中,成功kk次,排列方式有(nk)(nk)種,根據乘法原理,即可得到二項分佈的公式。
話外:對於均值和方差的計算,XiXi是標準的伯努利分佈,總髮生次數X=∑n1XiX=∑1nXi,所以E(X)=E(∑n1Xi)=∑n1E(Xi)=n∗pE(X)=E(∑1nXi)=∑1nE(Xi)=n∗p,同理方差D(x)=∑n1D(Xi)=n∗p∗(1−p)D(x)=∑1nD(Xi)=n∗p∗(1−p)
幾何分佈和負二項分佈
       這是一個比較簡單的分佈,其中負二項分佈是幾何分佈的一般形式,幾何分佈與二項分佈類似,也是由nn次伯努利分佈構成,隨機變數XX表示第一次成功所進行試驗的次數,則 
p(k)=P(X=k)=p∗(1−p)k−1,k=1,2,3,...
p(k)=P(X=k)=p∗(1−p)k−1,k=1,2,3,...

       負二項分佈是幾何分佈的一般形式,表示直到成功r次停止,顯而易見,當r=1時,它就是幾何分佈,則 
P(X=k)=(k−1r−1)pr∗(1−p)k−r
P(X=k)=(k−1r−1)pr∗(1−p)k−r
關於幾何分佈的期望與方差,E(X)=1/pE(X)=1/p,D(x)=(1−p)/p2D(x)=(1−p)/p2,關於期望的證明,E(X)=∑∞n=1n∗p∗qn−1=p∗∑∞n=1(qn)′=p∗(∑∞n=1qn)′=1/pE(X)=∑n=1∞n∗p∗qn−1=p∗∑n=1∞(qn)′=p∗(∑n=1∞qn)′=1/p,方差證明與期望證明類似,不再贅述…

超幾何分佈
       非常常見的一種分佈,常用來表示在NN個物品中有指定商品MM個,不放回抽取nn個,抽中指定商品的個數,即XX~H(N,n,M)H(N,n,M),則抽中k件的概率為: 
p(k)=P(X=k)=(Mk)∗(N−Mn−k)(Nn)
p(k)=P(X=k)=(Mk)∗(N−Mn−k)(Nn)

       實際應用中超幾何分佈例子很多,比如彩票開獎你所符合的數字個數等。
泊松分佈
       泊松分佈是離散型隨機變數分佈中相對較難的一種,泊松頻率函式定義為: 
P(X=k)=λk∗e−λk!,k=0,1,2,3,...
P(X=k)=λk∗e−λk!,k=0,1,2,3,...

       泊松分佈是二項分佈的極限形式,可有二項分佈概率公式推導得出,其中λ=n∗pλ=n∗p,當n>>pn>>p時, 
p(k)=(nk)∗pk∗(1−p)n−k=n!∗pk∗(1−p)n−kk!∗(n−k)!=n!∗(λn)k∗(1−λn)n−kk!∗(n−k)!=λkk!∗n!(n−k)!∗k!∗(1−λn)n∗(1−λn)−k
p(k)=(nk)∗pk∗(1−p)n−k=n!∗pk∗(1−p)n−kk!∗(n−k)!=n!∗(λn)k∗(1−λn)n−kk!∗(n−k)!=λkk!∗n!(n−k)!∗k!∗(1−λn)n∗(1−λn)−k

當nn->∞∞時,λnλn->0,n!(n−k)!∗k!n!(n−k)!∗k!->1,(1−λn)n(1−λn)n->e−λe−λ,(1−λn)−k(1−λn)−k->1,所以 
p(k)−>λk∗e−λk!
p(k)−>λk∗e−λk!
泊松分佈的期望和方差均為λλ,證明過程嚴格按照定義即可,注意在證明過程中使用到了eλ的泰勒展開eλ的泰勒展開
       泊松分佈主要用來研究單位時間或單位空間內某時間的發生次數,同時事件的發生必須是相互獨立的,比如單位時間內通過某一交通燈的車輛數等。λλ大概等於20時,泊松分佈基本可以近似為正態分佈進行處理。 
       泊松分佈用來衡量事件的穩定性是一個不錯的方法,再配合一些統計學上的檢驗方法,能夠做很多東西,在之後的連續型隨機變數中,有一種分佈叫指數分佈,它與泊松分佈密不可分,可由泊松分佈推匯出
--------------------- 
作者:天空中的一縷微風 
來源:CSDN 
原文:https://blog.csdn.net/zlbflying/article/details/47777943?utm_source=copy 
版權宣告:本文為博主原創文章,轉載請附上博文連結!