1. 程式人生 > >深度學習中常見分佈-正態分佈和伽瑪分佈

深度學習中常見分佈-正態分佈和伽瑪分佈

正態分佈Normal distribution)又名高斯分佈Gaussian distribution),是一個在數學物理工程領域都非常重要的概率分佈,在統計學的許多方面有著重大的影響力。

隨機變數X服從一個數學期望μ標準方差σ2的高斯分佈,記為:

XN(μ,σ2),
f(x) = {1 \over \sigma\sqrt{2\pi} }\,e^{- {{(x-\mu )^2 \over 2\sigma^2}}}

正態分佈的期望值μ決定了其位置,其標準差σ決定了分佈的幅度。因其曲線呈鐘形,因此人們又經常稱之為鐘形曲線。我們通常所說的標準正態分佈μ = 0,σ = 1的正態分佈(見右圖中綠色曲線)。


概率密度函式

正態分佈概率密度函式均值為μ 方差σ2 (或標準差σ)是高斯函式的一個例項:

f(x;\mu,\sigma)=\frac{1}{\sigma\sqrt{2\pi}} \, \exp \left( -\frac{(x- \mu)^2}{2\sigma^2} \right)

(請看指數函式以及π.)

如果一個隨機變數X服從這個分佈,我們寫作 X ~ N(μ,σ2). 如果μ = 0並且σ = 1,這個分佈被稱為標準正態分佈,這個分佈能夠簡化為

f(x) = \frac{1}{\sqrt{2\pi}} \, \exp\left(-\frac{x^2}{2} \right)

右邊是給出了不同引數的正態分佈的函式圖。

正態分佈中一些值得注意的量:

  • 密度函式關於平均值對稱
  • 平均值是它的眾數(statistical mode)以及中位數(median)
  • 函式曲線下68.268949%的面積在平均值左右的一個標準差範圍內
  • 95.449974%的面積在平均值左右兩個標準差的範圍內
  • 99.730020%的面積在平均值左右三個標準差的範圍內
  • 99.993666%的面積在平均值左右四個標準差的範圍內
  • 反曲點
    (inflection point)在離平均值的距離為標準差之處

伽瑪分佈

伽瑪分佈(Gamma Distribution)是統計學的一種連續概率函式。Gamma分佈中的引數α稱為形狀引數(shape parameter)β稱為尺度引數(scale parameter)



實驗定義與概念
假設隨機變數X為 等到第α件事發生所需之等候時間, 密度函式為   特徵函式為  
Gamma的可加性 兩個獨立隨機變數X和Y,且X~Ga(a,γ),Y~Ga(b,γ),則Z = X+Y ~ Ga(a+b,γ)。注意X和Y的尺度引數必須一樣。 數學表示式 若隨機變數X具有概率密度 其中α>0,β>0,則稱隨機變數X服從引數α,β的伽馬分佈,記作G(α,β).
Gamma分佈的特殊形式 當形狀引數α=1時,伽馬分佈就是引數為γ的指數分佈,X~Exp(γ) 當α=n/2,β=1/2時,伽馬分佈就是自由度為n的卡方分佈,X^2(n)