1. 程式人生 > >如何深入理解時間序列分析中的平穩性?

如何深入理解時間序列分析中的平穩性?

來自 :http://www.zhihu.com/question/21982358

在引入ARMA模型之前,一般課本都會對時間序列的平穩性作一個描述,但是總感覺沒有描述特別清晰:
1. 通常時間序列模型要求的是協方差平穩,或者弱平穩,而對強平穩介紹很少,能否從數學角度分析比較兩者最大的不同在何處,具體影響哪些性質;
2. 從經濟學含義或者常用的金融學領域看,如何看待經濟學中的均衡與時間序列中的平穩性之間的關係和區別。

宣告:本文中所有引用部分,如非特別說明,皆引自Time Series Analysis with Applications in R.

接觸時間序列分析才半年,盡力回答。如果回答有誤,歡迎指出。



對第一個問題,我們把它拆分成以下兩個問題:

  1. Why stationary?(為何要平穩?)
  2. Why weak stationary?(為何弱平穩?)

Why stationary?(為何要平穩?)
每一個統計學問題,我們都需要對其先做一些基本假設。如在一元線性迴歸中(y_{i}=\beta _{0}+\beta _{1}x_{i}+\varepsilon _{i}),我們要假設:①x_{i}不相關且非隨機(是固定值或當做已知)②\varepsilon _{i}獨立同分布服從正態分佈(均值為0,方差恆定)。

在時間序列分析中,我們考慮了很多合理可以簡化問題的假設。而其中最重要的假設就是平穩。
The basic idea of stationarity is that the probability laws that govern the behavior of the process do not change over time.
平穩的基本思想是:時間序列的行為並不隨時間改變

正因此,我們定義了兩種平穩:
Strict stationarity: A time series {Z_{t}} is said to be strictly stationary if the joint distribution of Z_{t_{1}},Z_{t_{2}}, · · ·,Z_{t_{n}} is the same as that ofZ_{t_{1}-k},Z_{t_{2}-k}, · · · ,Z_{t_{n}-k}for all choices of natural number n, all choices of time points t_{1},t_{2}, · · · , t_{n} and all choices of time lag k.
強平穩過程:對於所有可能的n,所有可能的t_{1}
,t_{2}, · · · , t_{n}和所有可能的k,當Z_{t_{1}},Z_{t_{2}}, · · ·,Z_{t_{n}}的聯合分佈與Z_{t_{1}-k},Z_{t_{2}-k}, · · · ,Z_{t_{n}-k}相同時,我們稱其強平穩。

Weak stationarity: A time series {Z_{t}} is said to be weakly (second-order, or co-variance) stationary if:
① the mean function \mu (t) is constant over time, and
② γ(t, t − k) = γ(0, k) for all times t and lags k.
弱平穩過程:當①均值函式是常數函式且②協方差函式僅與時間差相關,我們才稱其為弱平穩。

此時我們轉到第二個問題:Why weak stationary?(為何弱平穩?)
我們先來說說兩種平穩的差別
  • 兩種平穩過程並沒有包含關係,即弱平穩不一定是強平穩,強平穩也不一定是弱平穩。
一方面,雖然看上去強平穩的要求好像比弱平穩強,但強平穩並不一定是弱平穩,因為其矩不一定存在
例子:{Z_{t}}獨立服從柯西分佈。{Z_{t}}是強平穩,但由於柯西分佈期望與方差不存在,所以不是弱平穩。(之所以不存在是因為其並非絕對可積。)
另一方面,弱平穩也不一定是強平穩,因為二階矩性質並不能確定分佈的性質
例子:Z_{1}\sim N(1,1),Z_{2}\sim Exp(1),Z_{3}\sim Poi(1)互相獨立。這是弱平穩卻不是強平穩。

知道了這些造成差別的根本原因後,我們也可以寫出兩者的一些聯絡
  • 一階矩和二階矩存在時,強平穩過程是弱平穩過程。(條件可簡化為二階矩存在,因為E(X^{2})\geq E(\left| X \right| )^2
  • 當聯合分佈服從多元正態分佈時,兩平穩過程等價。(多元正態分佈的二階矩可確定分佈性質)

而為什麼用弱平穩而非強平穩,主要原因是:強平穩條件太強,無論是從理論上還是實際上。
理論上,證明一個時間序列是強平穩的一般很難。正如定義所說,我們要比較,對於所有可能的n,所有可能的t_{1},t_{2}, · · · , t_{n}和所有可能的k,當Z_{t_{1}},Z_{t_{2}}, · · ·,Z_{t_{n}}的聯合分佈與Z_{t_{1}-k},Z_{t_{2}-k}, · · · ,Z_{t_{n}-k}相同。當分佈很複雜的時候,不僅很難比較所有可能性,也可能很難寫出其聯合分佈函式。
實際上,對於資料,我們也只能估算出它們均值和二階矩,我們沒法知道它們的分佈。所以我們在以後的模型構建和預測上都是在用ACF,這些性質都和弱項和性質有關。而且,教我時間序列教授說過:"General linear process(weak stationarity, linearity, causality) covers about 10% of the real data." ,如果考慮的是強平穩,我覺得可能連5%都沒有了。

對第二個問題:
教授有天在審本科畢業論文,看到一個寫金融的,用平穩時間序列去估計股票走勢(真不知這老兄怎麼想的)。當時教授就說:“金融領域很多東西之所以難以估計,就是因為其經常突變,根本就不是平穩的。
果不其然,論文最後實踐階段,對於股票選擇的正確率在40%。連期望50%都不到(任意一點以後要麼漲要麼跌)。

暑假裡自己用了一些時間序列的方法企圖開發程式性交易程式。
剛開始收益率還好,越往後就越...後面直接虧損了...(軟體是金字塔,第二列是利潤率)

虧損的圖當時沒截,現在也沒法補了,程式都刪了。
所以應該和平穩沒關係吧,畢竟我的做法也沒假設是平穩的。如果平穩我就不會之後不盈利了。
(吐槽)自己果然不適合做股票、期貨什麼的...太高階理解不能...

以上
張二喵黃國偉張雨木 等人贊同 我是外行,說點我的看法。

平穩不只是對很多實際過程的「簡化」,還是我們的「追求」,是一條時間序列裡面長期穩定不變的某些規律,是基本模型。

當面對不平穩的過程的時候,我們首先會想著去把這樣的過程變換成平穩的,找出裡面相對更不隨時間變化的、更「平穩」的那些東西來,更平穩的序列有更低的 Order of integration 。當然,找出這些不變的(或者相對更平穩的)東西來之後,並不代表就一定可以獲得真正意義上的預測能力。

舉兩個例子:
  1. 股票絕對價格的漲跌顯然不能滿足正態分佈,Bachelier (1900) 當時就犯了這樣的錯誤。當序列被 Osborne 處理過之後:\frac{S_{t}-S_{t-1}}{S_{t-1}}\approx \log S_t-\log S_{t-1},開始關注相對變化,這個序列才變得更「平穩」了。
  2. 反覆做差分變換 X_t=x_{t+k}-x_t,直到時間序列變得「平穩」為止,做的差分變換的次數即為Order of integration 。一條時間序列整體隨時間變化的趨勢消除,因而可以關注一些在整體變化之外的那些漲落,序列也因此變得相對更「平穩」。關於差分變換直至「平穩」的一個好例子就是「抑制了房價」「抑制了房價的增長」「抑制了房價增長的勢頭」「抑制了房價過快增長的勢頭」——經過多次差分變換,直到最終「抑制……增長」,得到了一條平穩的時間序列。

關於強平穩和弱平穩的差別:
  • 強平穩是事實上的平穩(同分布);
  • 弱平穩是統計量在觀測意義上的平穩(均值、方差)。

第二個問題,均衡跟穩定沒有關係。
  • 國家規定了某個商品的價格,這情況完全不均衡,但是巨穩定。
  • 一般均衡達到穩定,跟時間序列的穩定性還是兩碼事,例如矩可能不存在;又例如我選擇的時間序列的時間間隔尺度遠小於市場發生響應達到穩定的均衡的時間尺度,得到的序列還是可能是不穩定的。
張彩票鍾呂周永 贊同

平穩性可以說是時間序列的內部邏輯性,也就是說每一期的序列值與前幾期之間存在一種一致的結構性變化關係,只有這樣我們才能建立模型去分析並預測。其根本原因在於統計學或者計量經濟學是從數量規律的角度研究事情,如果事物本身的變化毫無規律,這時候還要用統計或計量去分析,那就毫無意義了

雲十里張子權 贊同 只知道第一個。

一開始引進平穩,是希望能假設時間序列兩個相鄰點之間的分佈相同,由此則可說明序列的性質不隨時間改變。時間序列是隨機過程的特例,兩個相鄰點指的是前後兩個不一定獨立的隨機變數。

這兩個隨機變數的分佈相同,最簡單的數學表示就是他們的任意階矩都相同,這就是強平穩。但顯然強平穩沒法驗證,就退而要求前兩階矩平穩,即前後兩個分佈均值和方差是一樣的。可以感覺這已經是個若得多的條件了,因為均值方差一樣而分佈不同的例子太多了…

那為什麼弱平穩還是應用廣泛呢?因為如果假設前後都是正態分佈,那前兩階矩就能確定所有階矩,則弱平穩就相當於強平穩了。

也可以反過來說,因為正態分佈的這個性質,所有前兩階矩相等被定義為了弱平穩。 以前看過一個介紹時間序列平穩性的帖子(跟樓主的問題不符),回憶如下:
假設你看到兩個酒鬼(即兩個隨機遊走序列)四處流浪,醉鬼相互不認識(即他們是獨立的),所以他們的路徑之間沒有任何有意義的關係。但假設這兩個隨機遊走序列是醉鬼與他的狗,這時儘管每個單獨的路徑仍然是一個不可預知的隨機遊走過程,然而醉酒和狗兩者之間的距離是可預見性。例如,如果狗遠離於他的主人,狗會傾向於朝他的方向移動,所以這兩個隨機遊走序列有接近的趨勢)。醉鬼和他的狗組成了一對協整序列。

如果兩個非平穩的時間序列某些線性組合是平穩的,則可以說這兩個序列具有協整關係。然後,我們就可以探索序列之間的長期均衡關係了。

先驗均衡何需強平穩;後驗離群何談弱平穩。道可道,非常道!

問題2:經濟學中的平穩性實際也是從演化和博弈中考慮的。是指巨集觀概率分佈的變化率在0附近小波動。不會有偏移,導致系統的轉換。,此時的數學解 看來是個“鞍點”
可能這就是你指的強穩定。 時間序列平穩性我是這樣理解的,變數或變數間的各種意義(均值、協方差、方差)只於時間間隔有關,而與時間間隔無關的。也就是說現實生活中經濟變數隨著時間不表現出變化的一致性,但現實中實際的時間序列資料往往是非平穩的,經濟變量表現為一致的上升或下降。平穩的時間序列你可以理解:價格圍繞價值上下波動的時間變動! 可以理解為一種對事實的簡化。 這個問題李子奈的計量經濟學相關的書籍裡有很詳實的解答