1. 程式人生 > >時間序列ARIMA模型相關知識

時間序列ARIMA模型相關知識

以下筆記內容來自於視訊

資料平穩性

平穩性
  • 要求經由樣本時間序列所得到的擬合曲線在未來的一段時間內仍能順著現有的形態“慣性”地延續下去
  • 要求序列的均值和方差不發生明顯變化
嚴平穩與弱平穩
  • 嚴:分佈不隨時間的改變而改變
  • 弱:期望與相關係數(依賴性)不變。未來某時刻的值依賴於其過去的資訊

ARIMA

自迴歸模型AR
  • 描述當前值與歷史值之間的關係,用變數自身的歷史時間資料對自身進行預測

  • AR必須滿足平穩性要求

  • p階自迴歸過程的公式定義,yt是當前值 mu是常數項 p是階數 gamma是自相關係數 epsilon是誤差
    y

    t = μ + i =
    1
    p
    γ i y t
    1
    + ϵ t y_{t} = \mu + \sum_{i=1}^{p}\gamma _{i}y_{t-1}+\epsilon _{t}

AR自身限制
  • 使用自身資料來預測
  • 必須具有平穩性
  • 必須具有自相關,如果自相關係數小於0.5,則不宜採用
  • 只適用於預測與自身前期相關的現象
移動平均模型 MA
  • 關注的是AR中的誤差項的累加

  • q階自迴歸過程的公式定義
    y t = μ + i = 1 q θ i ϵ t 1 + ϵ t y_{t} = \mu + \sum_{i=1}^{q}\theta _{i}\epsilon_{t-1}+\epsilon _{t}

  • 能有效消除預測中的隨機波動

自迴歸移動平均模型 ARMA
  • 自迴歸與移動平均的結合

  • 公式
    y t = μ + i = 1 p γ i y t 1 + ϵ t + i = 1 q θ i ϵ t 1 y_{t} = \mu + \sum_{i=1}^{p}\gamma _{i}y_{t-1}+\epsilon _{t}+\sum_{i=1}^{q}\theta _{i}\epsilon_{t-1}

ARIMA
  • ARIMA(p,d,q)全程差分自迴歸移動平均模型
  • d是時間序列成為平穩時所做的差分次數
  • 原理:將非平穩轉化為平穩時間序列然後將因變數僅對它的滯後值以及隨機誤差項的現值和滯後值進行迴歸所建立的模型

相關函式評估方法

自相關函式ACF
  • 有序的隨機變數序列與其自身相比較,ACF反映了同一序列在不同時序的取值之間的相關性

  • 公式
    A C F ( k ) = ρ k = C o v ( y t , y t k ) V a r ( y t ) ACF(k)=\rho _{k}=\frac{Cov(y_{t},y_{t-k})}{Var(y_{t})}

  • rho k的取值範圍為[-1, 1]

偏自相關函式 PACF
  • 對於一個平穩AR§模型,求出滯後k自相關係數p(k)時,實際上得到的並不是x(t)與x(t-k)之間單純的相關關係
  • x(t)同時還會受到中間k-1個隨機變數x(t-1)、x(t-2)、…、x(t-k+1)的影響,而這k-1個隨機變數又都和x(t-k)具有相關關係,所以自相關關係p(k)裡實際摻雜了其他變數對x(t)與x(t-k)的影響
  • 剔除了中間k-1個隨機變數x(t-1)、x(t-2)、…、x(t-k+1)的干擾後,x(t-k)與x(t)影響的相關程度
  • ACF還包含了其他變數的影響,而PACF是嚴格這兩個變數之間的相關性

建立ARIMA模型

p,d,q階數確定
模型 ACF PACF
AR§ 衰減趨於零 p階後截尾
MA(q) q階後截尾 衰減趨於零
ARMA(p, q) q階後衰減趨於零 p階後衰減趨於零
  • 截尾:落在置信區間內(95%的點都符合該規則)
建模流程
  • 將序列平穩(差分法確定d)
  • p和q確定:ACF和PACF(也可畫出散點圖檢視)
  • ARIMA(p,d.q)

引數選擇

AIC與BIC:越小越好
  • k為模型引數個數, n為樣本數量,L為似然函式

  • AIC 赤池資訊準則

    A I C = 2 k 2 l n ( L ) AIC=2k-2ln(L)

  • BIC 貝葉斯資訊準則
    B I C = k l n ( n ) 2 l n ( L ) BIC=kln(n)-2ln(L)

模型殘差檢驗
  • ARIMA模型的殘差是否是平均值為0且方差為常數的正態分佈
  • QQ圖:線性即正態分佈