1. 程式人生 > >時間序列之AR(自迴歸模型)

時間序列之AR(自迴歸模型)

一個序列經過預處理被識別為平穩非白噪聲序列,那就說明該序列是一個蘊含著相關資訊的平穩序列。在統計上我們通常是建立一個線性的模型來擬合該序列的發展,藉此提取該序列中的有用資訊,ARMA是目前最常用的平穩序列擬合模型。

AR模型

具有下列結構的模型稱為p階自迴歸模型:
p階自迴歸數學表達
這裡寫圖片描述時,自迴歸模型又稱中心AR(p)模型,非中心化AR(p)序列都可以通過下面的變換轉化為中心化AR(p)序列。中心化變化實質就是非中心化序列整個平移了一個常數位移,這種整體移動對序列值之間的相關關係沒有任何影響,所以在今後的分析AR模型的相關關係時,都可以簡化成對它中心化模型進行分析。

AR模型平穩性差別

要擬合一個平穩序列的發展,用來擬合的模型顯然也應該是平穩的。AR模型是常用的平穩序列的擬合模型之一,但並非所有的AR模型都是平衡的。
R提供了多種序列擬合模型,這裡是最常用的兩種。

arima.sim函式擬合

這是一個便捷的序列擬合函式,它可以擬合平衡AR序列,MA序列、平衡ARMA序列,以及ARIMA序列。
式中:
arima.sim(n,list(ar= ,ma= ,order=),sd=)

-n:擬合序列長度
-list:指定具體的模型常數,其中:
(1)擬合平穩AR(p)模型,要給出自迴歸係數。如果指定擬合的AR模型是非平穩模型,系統會報錯。
(2)擬合MA(q)模型,要給出移動平均係數。
(3)擬合平穩ARMA(p,q)模型,除了需要給出自迴歸係數與移動平均係數。如果指定擬合的ARMA模型為非平穩模型,系統會報錯。
(4)擬合ARIMA(p,d,q)模型,除了需要給出的自迴歸係數和移動平均係數,還需要新增order選項.order = c(p,d,q),p為自迴歸係數,d為差分系數,q為移動平均階數。
-sd:指定序列的標準差,不特殊指定,系統預設:sd = 1.

filter函式可以擬合AR序列(無論是否平穩)和MA序列.filter函式的命令格式為:
filter(e,filter =,method =,circular =)

-e:隨機波動序列的變數名
-filter:指定模型係數,其中
(1)AR(P)模型為filter = c(o1,o2,…,op);
(2)MA(q)模型為filter = c(1,-o1,-o2,…,-oq);
-method:指定擬合AR模型還是MA模型
(1)method= “recursive”為AR模型
(2)method= “convolution”為MA模型
-circular:擬合MA模型時專用的一個選項,circular = T,可以避免NA資料出現。

考察如下四個序列的序列值,並繪製時序圖:
四個AR模型
(一)第一個式子

x1 = arima.sim(n=100,list(ar=0.8))
ts.plot(x1)

時間序列圖
可以看出這個模型是平穩的
(三)第三個式子

x3 = arima.sim(n=100,list(ar=c(1,-0.5)))
ts.plot(x3)

時間序列圖
可以看出這個模型是平穩的
(二)第二個式子

e = rnorm(100)
x2 = filter(e,filter = -1.1,method = "recursive")
ts.plot(x2)

時間序列圖
可以看出這個模型是非平穩的

(四)第四個式子

e = rnorm(100)
x4 = filter(e,filter= c(1,0.5),method = "recursive")
ts.plot(x4)

時間序列圖
可以看出這個模型是平穩的

圖示法是一種粗糙的直觀判別方法,我們有了兩種準確的平穩差別方法:特徵根判別和平穩域判別。

特徵根判別
實際上是要求AR(p)模型的p個特徵根都在單位圓內,所以AR(p)模型平穩的充要條件是它的p個特徵根都在單位圓內。
根據特徵根和自迴歸係數多項式的根成倒數的性質,AR模型平穩的等價判別條件是該AR模型的自迴歸係數的多項式的根,都在單位圓外。

平穩域差別
對於一個AR(p)模型而言,如果沒有平穩性的要求,實際也意味著對引數向量沒有任何限制,它們可以取遍p維歐式空間的任意一點,但是如果加了平穩性限制,引數向量就只能取p維歐式空間的一個子集,使得特徵根都在單位圓的係數集合,稱為AR(p)模型的平穩域。
對於低階AR模型用平穩域的方法判別更加簡便。
(1)AR(1)平穩域是【-1,1】這裡寫圖片描述
(2)AR(2)平穩域是一個三角型區域
這裡寫圖片描述
分別用特徵根法判別三個模型:
特徵根與平穩域判別法
特徵根與平穩域判別法

自相關係數的性質

1.一是拖尾性。
2.指數衰減。
考查如下四個平穩的AR模型的自相關圖
四個平穩的AR模型

x1 = arima.sim(n=1000,list(ar=0.8))
acf(x1)

這裡寫圖片描述

x2 = arima.sim(n=1000,list(ar=-0.8))
acf(x2)

這裡寫圖片描述

x3 = arima.sim(n=1000,list(ar=c(1,-0.5)))
acf(x3)

這裡寫圖片描述

x4 = arima.sim(n=1000,list(ar=c(-1,-0.5)))
acf(x4 )

這裡寫圖片描述
從圖中可以看出, 這四個平穩的AR模型,不論他們是AR1模型還是AR2模型,不論他們的特徵根是實根還是復根,是正根還是負根,它們的自相關性都呈現出拖尾性與呈指數衰減到零值附近的性質。
但是由於特徵根的不同,它們自相關係數的衰減方式不一樣,有的自相關係數是按指數衰減到零(如模型1),有的是正負間的衰減(如模型2),還有些自迴歸係數會呈現出類似週期性的餘弦衰減,即具有“偽週期”特徵(如模型3),這些都是平穩模型自相關性常見的特徵。

偏相關性係數

對於一個平穩AR(p)模型,求出滯後k自相關係數時,實際上並不是x(t)與x(t-k)之間單純的相關關係,因為x(t)同時還會受到中間(k-1) 個隨機變數的影響,而這(k-1)個隨機變數又都和x(t-k)具有相關關係,所以自相關係數裡實際上摻雜了其他變數對x(k)和x(t-k)的相關影響,為了單純了測量x(t-k)對x(k)的影響,引進的偏自相關性係數的概率。
平穩的AR(p)模型的偏自相關係數具有p步截尾性。

pacf(x1)
pacf(x2)
pacf(x3)
pacf(x4)

這裡寫圖片描述
這裡寫圖片描述
這裡寫圖片描述
這裡寫圖片描述
這裡寫圖片描述
這裡寫圖片描述
由於樣本的隨機性,樣本偏自相關係數不會和理論偏自相關係數一樣嚴格截尾,但是可以看出兩個AR(1)模型的樣本偏自相關係數1階顯著不為0,1階之後都近似為0,而兩個AR(2)模型的樣本的偏自相關係數,2階之後都近似
為零。樣本的偏自相關圖可以直觀的驗證AR模型偏自相關係數截尾性。