1. 程式人生 > >關於《損失模型》的一點筆記——第二部分精算模型-1隨機變數與分佈函式

關於《損失模型》的一點筆記——第二部分精算模型-1隨機變數與分佈函式

一般的精算模型嘗試表現出未來不確定的支付流,不確定性包括事件是否會發生、發生的時間以及損失量。

一些概念:
1. 現象是指可以觀測到的發生。
2. 試驗是指在一定條件下對某給定現象的一個觀測。
3. 一次試驗的最終觀測稱為結果。
4. 事件是一個或多個結果的集合。
5. 隨機現象是指試驗可能會有一個以上的結果。
6. 具有隨機現象的事件稱為不確定結果。
7. 概率是對一個事件的結果發生可能性的度量,這個度量經過標準化處理,從0增加到1的數值表示。
8. 隨機變數是一個函式,它對每一個可能結果賦予一個數值。

分佈函式和4個模型

某隨機變數X的累積分佈函式F(x)滿足以下四個必要條件
1.對所有x,0≤F(x)≤1。
2.F(x)是非降的。
3.F(x)是右連續的。
4.

limxF(x)=0limx+F(x)=1

基於此的4個模型大概長這個樣子(靈魂畫作)
這裡寫圖片描述

第一行左邊是典型的F(x)=ax+b,具體約束參照四個必要條件,abmn均為正數,不詳細說了。
第一行右邊是F(x)=1b/xa
第二行左邊是F(x)={0x0m0x<anaxb1xb
第二行右邊是F(x)={0x01beaxx0,那個圈是畫錯的,無視就好了。(其實我是想畫0和函式的值是區分的,手抖畫錯了2333)

以上4個模型就是常用的分佈函式,前兩個是連續分佈,第三個是離散分佈,第四個是混合分佈。
從我個人的角度理解,分佈函式常常用於描述事物本身。

生存函式

生存函式是分佈函式的“補函式”,記為S(x)。S(x)=1-F(x),故而
1.對所有x,0≤S(x)≤1。
2.S(x)是不增的。
3.F(x)是右連續的。
4.limxS(x)=1limx+S(x)=0

概率密度函式

概率密度函式f(x),簡稱為密度函式,它表示分佈函式的導數或者生存函式導數的負值,即f(x)=F’(x)=-S’(x),有時縮寫為pdf。
隨機變數在密度函式比較高的區域,發生的可能性將高於比較低的區域。

概率函式

概率函式p(x),也稱為概率質點函式,表示隨機變數在概率值為非零點的概率。一般用在離散型分佈函式或者混合型分佈函式。

風險率

風險率h(x),也稱作死亡力(也寫作μ(x))或者失效率(也寫作λ(x)),表示密度函式與生存函式的比值,即h(x)=f(x)/S(x)
所以,先前的4個模型變成了這個樣子
這裡寫圖片描述

眾數

眾數是指最有可能發生的值,對於離散型則是概率函式最大的點,對於連續型則是密度函式最大值的點。

隨機變數X的k階原點矩,為隨機變數k次冪的期望(平均)值(如果它存在的話)。用E(X^k)。一階原點矩為隨機變數的均值,通常記為μ。
μx={xkf(x)dxjxjkp(xj)

一個特殊的離散分佈模型——經驗分佈模型

經驗分佈模型是基於一個樣本量為n,並對每個資料點賦予概率1/n的離散分佈模型。
模型中的均值等於算數平均值。

中心矩、變異係數、偏度與峰度

隨機變數的k階中心矩為該變數與其均值的偏差的k次冪的期望值,一般表示為E[(X-μ)^k]或μ_k。
通常稱呼二階中心矩為方差σ2,它的平方根叫做標準差σ。
標準差與均值的比值稱作變異係數。
三階中心矩與標準差立方的比值稱為偏度,τ1=μ3/σ3,也稱作偏度係數。
四階中心矩與標準差的四次方的比值稱為峰度,τ2=μ4/σ4,也稱作峰度係數。

中心距計算公式: