1. 程式人生 > >對數正態分佈(Log-Normal Distribution)

對數正態分佈(Log-Normal Distribution)

2017.11.1 人要有發恥心和羞恥心,突然想到了這麼一句話,MARK一個部落格

困惑了好久,還是寫個部落格Mark一下,方便以後查詢使用

  • 概率密度函式
  • 區域性期望

- 相關分佈

概率密度函式

對數正態分佈是對數為正態分佈的任意隨機變數的概率分佈。如果Y是正態分佈的隨機變數,則exp(Y)是對數正態分佈;同樣,如果X是對數正態分佈,則ln(X)為正態分佈,如果一個變數可以看成是許多很小獨立因子的乘積,則這個變數可以看作是對數正態分佈。 給定一個x>0,對數正態分佈的概率密度函式為:

f(x;μ;σ)=12πxσe(lnxμ)22σ2
其中,μσ分別是變數對數的平均值和標準差。期望值和方差分別為:
E
(X)=eμ+σ2/2

var(X)=(eσ21)e2μ+σ2
給定期望值與方差,也可以用這個關係求μσ的大小
μ=ln(E(X))12ln(1+var(X)E(X)2)σ2=ln(1+var(X)E(X)2)
求解時,需要將μσ計算出來帶入到上面的f(x;μ;σ)中使用matlab帶有的logncdflognpdf獲取對數正態分佈的累積分佈函式和密度函式。
註解:已知變換後的資料的統計特徵可以反過來推匯出原始資料的統計特徵,不存在資料資訊的損失(對數轉換後變數的均值可以直接由樣本資料的均值得到,但不進行變化卻需要由樣本均值方法兩方面去推斷得到),參見:機器學習小組知識點17
也可以發現對數正態分佈實際上是對資料進行了對數變化,從而變成了正態分佈,方便得到相關的統計學變數。

區域性期望

隨機變數X在閾值k上的區域性期望定義為:

g(k)=k(xk)f(x)dx
其中f(x)是概率密度,對於對數正態概率密度,這個定義為:
g(k)=exp(μ+σ2/2)Φ(ln(k)+μ+σ2σ)kΦ(ln(k)+μσ)
其中Φ是標準正態分佈的累積分佈函式,對數正態分佈的區域性期望在經濟領域應用廣泛。

相關分佈

這裡指的是與高斯分佈的關係
如果Y=ln(X)XLogN(μ,σ2),則YN(μ,σ2)是正態分佈.
如果Xm=LogN(μ,σ

2m),m=1...n¯¯¯¯¯¯¯是有同樣%μ引數,而σ可能不同的統計獨立對數正態分佈變數,並且Y=Nm=1Xm,則Y也是正態分佈變數:YLogN(nμ,nm=1σ2m),滿足高斯分佈求和性質。

引數的最大似然估計

為了確定對數正態分佈引數μσ最大似然估計,可以採用與正態分佈引數最大似然估計同樣的方法。

fL(x;μ,σ)=1xfN(lnx