1. 程式人生 > >概率論與數理統計——函式分佈

概率論與數理統計——函式分佈

一、隨機變數

1、隨機變數(Random Variable)的定義:

    設隨機試驗的樣本空間為S,若X= X (e)

    為定義在S 上的實值單值函式,則稱X(e)為隨機變數,簡寫為

   

2、說明

  • 隨機變數 X(e):S\rightarrow R 為一對映,其自變數具有隨機性;
  • 隨機事件可以表示為  A=\begin{Bmatrix} e:X(e)\in I \end{Bmatrix}=\begin{Bmatrix} X\in I \end{Bmatrix},I\subset R
  • 對於 i\neq j ,則必有  \begin{Bmatrix} X=i \end{Bmatrix}\cap \begin{Bmatrix} X=j \end{Bmatrix}=\varnothing 
  • 一般用大寫英文字母X,Y,Z或者希臘字母 \xi,\eta 等來表示隨機變數

二、離散型隨機變數

1、概念定義:

  • 若隨機變數的取值為有限個或可數個,則稱 X 為離散型隨機變數
  • 可數集(也稱可列集):是指能與自然數集N建立一一對應的集合.即其中的元素都是可以被數到的.
  • 不可數集:是無窮集合的一種.一個無窮集合和自然數集之間如果不存在一一對應關係.那麼它就是一個不可數集.

      

2、0—1分佈

(1)0—1分佈的定義:

    若X 的概率分佈律為:

    其中0<p<1, 就稱X 服從引數為p的0-1分佈(或兩點分佈),記為 X ~0-1(p)或 X ~B(1,p).

    其分佈律還可以寫為P(X =k )=p k(1- p),1-k,k =0,1.(X 服從退化分佈: 若 P( X = c) =1.)

(2)0—1分佈的應用

        一個隨機試驗,設A是一隨機事件,且P(A)=p(0<p<1). 若僅考慮事件A發生與否,就可以定義一個服從引數為p的0-1分佈的隨機   變數:

       來描述可這個隨機試驗的結果.只有兩個能結果的試驗, 稱為貝努利(Bernoulli

)試驗,故兩點分佈有時也稱為貝努利分佈.

       設試驗E只有兩個可能的結果: AA,且P ( A)= p,0<p <1.將E獨立地重複地進行n次,則稱這一串重複的獨立試驗為n重貝努利實驗.設X 表示 n重貝努利試驗中結果A發生的次數,則X的可能取值為0,1 , P(X=k)=C_{n}^{k}p^{k}(1-p)^{n-k}

3、二項分佈

        若X的概率分佈律為 P(K=k)=C_{n}^{k}p^{k}(1-p)^{n-k},k=0,1,..,n 其中n \leq 1,0<p<1, 

就稱X服從引數為n,p的二項分佈, 記為X~B(n,p),

可以證明:1=(p+q)^{n}=\sum _{k=0}^{n}C^{k}_{n}p^{k}q^{n-k} ,其中q=1-p.

4、泊松分佈

(1)泊松分佈的定義

      若X的概率分佈律為 

            P(X=k)=\frac{\lambda ^{k}e^{-\lambda }}{k!},k=0,1,2,..,

       其中\lambda>0 ,就稱X服從引數為\lambda的泊松分佈(Poisson),記為 X\sim P(\lambda )

 

       根據泰勒展開式可得:e^{\lambda }=\sum _{k=0}^{\infty }\frac{\lambda ^{k}}{k!}

(2)如果某事件以固定強度λ,隨機且獨立地出現,該事件在單位時間內出現的次數(個數)可以看成是服從泊松分佈.

       二項分佈與泊松分佈有以下近似公式:

       當n>1,0<p<1時,C^{k}_{n}p^{k}(1-p)^{n-k}\approx \frac{e^{-\lambda }\lambda ^{k}}{k!} ,其中\lambda =np,

       即當n>1,0<p<1時,二項分佈B(n,p)可以用泊松分佈 \Pi (np) 來近似。

5、幾何分佈

(1)定義

      若X的概率分佈律為:P(X=k)=p(1-p)^{k-1},k=1,2,3,...

      其中0<p<1,稱X服從引數為p的幾何分佈(Geometric),記為X~Geom(p).

(2)幾何分佈的用途

      在重複多次的貝努裡試驗中,試驗進行到某種結果第一次出現為止,此時的試驗總次數服從幾何分佈。

三、分佈函式

       

(1)分佈函式的用途:可以給出隨機變數落入任意一個範圍的可能性

        一般地,離散型隨機變數的分佈函式為階梯函式。

        設離散型隨機變數X的分佈律為 P{X= x_{k} }= p_{k} ,k=1,2,...,X的分佈函式為 F(x)=\sum _{x_{k}\leq x}p_{k}

        F(x)在x= x_{k} ,(k=1,2,...)處有跳躍,其跳躍值為p_{k}=P{X=x_{k}}.

(2)F(X)的性質

  • 0\leq F(x)\leq 1
  • F(x) 單調不減,對於任意 x_{1}<x_{2} ,有0\leq P(x_{1}<X\leq <x_{2})=F(x_{2})-F(x_{1})
  • F(-\infty )=0,F(+\infty)=1
  • F(x) 是右連續函式,即F(x+0)=F(x).

四、連續型隨機變數及其概率密度

1、定義:

     對於隨機變數X的分佈函式F(x),若存在非負的函式f(x),使對於任意實數 x 有:

             F(x)=\int_{-\infty}^{x}f(t)dt

     則稱X 為連續型隨機變數,其中f( x )稱為X的概率密度函式, 簡稱概率密度.有時也寫為fx(x)

2、f(x)的性質

(1)  f(x)\geq 0

(2)  \int_{-\infty}^{+\infty}f(x)dx=1,F(+\infty)=1

五、均勻分佈和指數分佈

1、均勻分佈

2、指數分佈

(1)指數分佈定義:

若X的概率密度函式為 

                    f(x)=\left\{\begin{matrix}\lambda e^_{-\lambda x},x>0 \\ 0,x\leq 0 \end{matrix}\right.,

其中\lambda >0,就稱X服從引數為\lambda的指數分佈(Exponential)記為X~E(\lambda),或X~Exp(\lambda).

分佈函式為 

                   F(x)=\left\{\begin{matrix}1-e^{-\lambda x},x>0 \\ 0,x\leq 0 \end{matrix}\right.

(2)性質(指數分佈具有無記憶性)

      對於  t_{0}>0,t>0

    P(X>t_{0}+t|X>t_{0})=\frac{P(X>t_{0}+t,X>t_{0})}{P(X>t_{0})}

                                           =\frac{P(X>t_{0}+t)}{P(X>t_{0})}=\frac{1-F(t_{0}+t)}{1-F(t_{0})}

                                           =\frac{e^{-\lambda (t_{0}+t)}}{e^{-\lambda t_{0}}}=e^{-\lambda t}=P(X>t)

(3)指數分佈用途

  • 指數分佈可以用來表示獨立隨機事件發生的時間間隔,比如旅客進機場的時間間隔、中文維基百科新條目出現的時間間隔等等;
  • 在排隊論中,一個顧客接受服務的時間長短也可用指數分佈來近似;
  • 無記憶性的現象(連續時).

五、正態分佈

(1)定義

   

   

(2)標準正態分佈

六、隨機變數函式的分佈

已知隨機變數X 的分佈,Y=g(X),函式g(*)已知,求y的分佈. 一般,若已知X的概率分佈,Y=g(x),求Y的概率分佈的過程為:

  • 先給出Y的可能取值;再利用等價事件來給出概率分佈。
  • 若X為離散型隨機變數,則先寫出Y的可能取值:y_{1},y_{2},...,y_{j},...y_{n} 再找出{Y=y_{j}} 的等價事件{X\in D},得P(Y=y_{j})=P(X\in D)
  • 若X為連續型隨機變數,先根據X的取值範圍,給出Y的取值範圍;然後攜程Y的概率分佈函式:F_{Y}=P(Y\leq y) ,找出{Y \leq y}的等價事件{X\in D} ,得F_{Y}(y)=P(X\in D);再求出Y的概率密度函式 f_{Y}(y).

   

   一般地,若隨機變數 X\sim N(\mu ,\sigma ^{2}) ,則有Y=aX+b \Rightarrow Y\sim N(a\mu +b,a^{2}\sigma ^{2})