1. 程式人生 > >在統計學中概率分佈中的概率密度函式PDF,概率質量PMF,累積分佈CDF

在統計學中概率分佈中的概率密度函式PDF,概率質量PMF,累積分佈CDF

一. 概念解釋

PDF:概率密度函式(probability density function), 在數學中,連續型隨機變數的概率密度函式(在不至於混淆時可以簡稱為密度函式)是一個描述這個隨機變數的輸出值,在某個確定的取值點附近的可能性的函式。

PMF : 概率質量函式(probability mass function), 在概率論中,概率質量函式是離散隨機變數在各特定取值上的概率。

CDF : 累積分佈函式 (cumulative distribution function),又叫分佈函式,是概率密度函式的積分,能完整描述一個實隨機變數X的概率分佈。

二. 數學表示

PDF:如果XX是連續型隨機變數,定義概率密度函式為

fX(x),用PDF在某一區間上的積分來刻畫隨機變數落在這個區間中的概率,即

Pr(aXb)=abfX(x)dx
PMF:如果XX離散型隨機變數,定義概率質量函式為fX(x),PMF其實就是高中所學的離散型隨機變數的分佈律,即
fX(x)=Pr(X=x)
比如對於擲一枚均勻硬幣,如果正面令X=1,如果反面令X=0,那麼它的PMF就是
fX(x)={12 if x{0,1}0 if x{0,1}
CDF:不管是什麼型別(連續/離散/其他)的隨機變數,都可以定義它的累積分佈函式,有時簡稱為分佈函式。

對於連續型隨機變數,顯然有
FX(x)=Pr(Xx)=xfX(t)dt
那麼CDF就是PDF的積分,PDF就是CDF的導數。
對於離散型隨機變數,其CDF是分段函式,比如舉例中的擲硬幣隨機變數,它的CDF為
FX(x)=Pr(Xx)={0 if x<012 if 0x<11 if x1

三.概念分析

 根據上述,我們能得到一下結論:

 1)PDF是連續變數特有的,PMF是離散隨機變數特有的;
 2)PDF的取值本身不是概率,它是一種趨勢(密度)只有對連續隨機變數的取值進行積分後才是概率,也就是說對於連續值確定它在某一點的概率是沒有意義的;
 3)PMF的取值本身代表該值的概率。

四.分佈函式的意義

  我們從兩點來分析分佈函式的意義:
  
  1.為什麼需要分佈函式?

  對於離散型隨機變數,可以直接用分佈律來描述其統計規律性,而對於非離散型的隨機變數,如連續型隨機變數,因為我們無法一一列舉出隨機變數的所有可能取值,所以它的概率分佈不能像隨機變數那樣進行描述,於是引入PDF,用積分來求隨機變數落入某個區間的概率。分佈律不能描述連續型隨機變數,密度函式不能描述離散隨機變數,因此需要找到一個統一方式描述隨機變數統計規律,這就有了分佈函式。另外,在現實生活中,有時候人們感興趣的是隨機變數落入某個範圍內的概率是多少,如擲骰子的數小於3點的獲勝,那麼考慮隨機變數落入某個區間的概率就變得有現實意義了,因此引入分佈函式很有必要。
  2. 分佈函式的意義

  分佈函式F(x)F(x)在點xx處的函式值表示XX落在區間(−∞,x](−∞,x]內的概率,所以分佈函式就是定義域為RR的一個普通函式,因此我們可以把概率問題轉化為函式問題,從而可以利用普通的函式知識來研究概率問題,增大了概率的研究範圍。

五:深度理解參考文獻