R語言與時間序列學習筆記（1）

阿新 • • 發佈：2019-01-07

今天分享的是R語言中時間序列的有關內容。主要有：時間序列的建立，ARMA模型的建立與自相關和偏自相關函式。

一、時間序列的建立

時間序列的建立函式為：ts().函式的引數列表如下：

ts(data = NA, start = 1, end = numeric(),frequency = 1,

deltat = 1, ts.eps = getOption("ts.eps"), class = , names = )

引數說明：data：這個必須是一個矩陣，或者向量，再或者資料框frame

Frequency：這個是時間觀測頻率數，也就是每個時間單位的資料數目

Start：時間序列開始值，允許第一個個時間單位出現數據缺失

舉例：ts(matrix(c(NA,NA,NA,1:31,NA),byrow=T,5,7),frequency=7,names=c("Sun","Mon ","Tue", "Wen" ,"Thu","Fri"," Sat"))

執行上面的程式碼就可以得到一個日曆：

Sun Mon Tue Wen Thu Fri Sat

NA NA NA 1 2 3 4

5 6 7 8 9 10 11

12 13 14 15 16 17 18

19 20 21 22 23 24 25

26 27 28 29 30 31 NA

在R語言中本身也有不少資料集，比如統計包中的sunspots，你可以通過函式data(sunspots)來呼叫它們。

二、一些時間序列模型

這裡主要介紹AR，MA，隨機遊走，餘弦曲線趨勢，季節趨勢等

首先介紹一下AR模型：AR模型，即自迴歸（AutoRegressive,AR）模型，數學表示式為：　　AR :y(t)=a1y(t-1)+...any(t-n)+e(t)

其中，e(t)為均值為0，方差為某值的白噪聲訊號。

那麼產生AR模型的資料，我們就有兩種方法：1、呼叫R中的函式filter（線性濾波器）去產生AR模型；2、根據AR模型的定義自己編寫函式

先說第一種方法：呼叫R中的函式filter（線性濾波器）去產生AR模型

介紹函式filter的用法如下：

filter(x, filter, method = c("convolution", "recursive"),

       sides = 2, circular = FALSE, init)

對於AR（2）模型x（t）=x(t-1)--0.9x(t-2)+e(t)

w<-rnorm(550)#我們假定白噪聲的分佈是正態的。

x<-filter(w,filter=c(1,-0.9),"recursive")

#方法：無論是“卷積”或“遞迴”（可以縮寫）。如果使用移動平均選擇“卷積”：如果“遞迴”便是選擇了自迴歸。

再說第二種方法：依據定義自己程式設計產生AR模型，還是以AR（2）模型x（t）=x(t-1)--0.9x(t-2) +e(t)為例，可編寫函式如下：

w<-rnorm(550)

AR<-function(w){

x<-w

x[2]=x[1]+w[1]

for(i in 3:550)

x[i]=x[i-1]-0.9*x[i-2]+w[i]

}

呼叫AR（W）即可得到。如果對相同的隨機數，我們可以發現兩個產生的時間序列是一致的。當然對於第二種方法產生的序列需要轉換為時間序列格式，用as.ts()處理。

類似的，我們給出MA，隨機遊走的模擬：

MA模型：

w<-rnorm(500)

v<-filter(w,sides=2,rep(1,3)/3)

隨機遊走：

w<-rnorm(200)

x<-cumsum(w)#累計求和，seeexample：cumsum(1:!0)

wd<-w+0.2

xd<-cumsum(wd)

可以做出相應的圖形：

再說一下季節性模型：

最簡單的季節模型就是一個分段的周期函式。比如說某地區一年的氣溫就是一個季節性模型。利用TSA包裡給出的資料tempdub我們可以發現他就是這樣的模型

給出驗證：

library(TSA)

data(tempdub)

month<-season(tempdub)

model1<-lm(tempdub~month)

summary(model1)

根據R輸出的結果：

Call:

lm(formula = tempdub ~month)

Residuals:

Min 1Q Median 3Q Max

-8.2750 -2.2479 0.1125 1.8896 9.8250

Coefficients:

Estimate Std. Error t valuePr(>|t|)

(Intercept) 16.608 0.987 16.828 < 2e-16 ***

monthFebruary 4.042 1.396 2.896 0.00443 **

monthMarch 15.867 1.396 11.368 < 2e-16 ***

monthApril 29.917 1.396 21.434 < 2e-16 ***

monthMay 41.483 1.396 29.721 < 2e-16 ***

monthJune 50.892 1.396 36.461 < 2e-16 ***

monthJuly 55.108 1.396 39.482 < 2e-16 ***

monthAugust 52.725 1.396 37.775 < 2e-16 ***

monthSeptember 44.417 1.396 31.822 < 2e-16 ***

monthOctober 34.367 1.396 24.622 < 2e-16 ***

monthNovember 20.042 1.396 14.359 < 2e-16 ***

monthDecember 7.033 1.396 5.039 1.51e-06 ***

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’1

Residual standarderror: 3.419 on 132 degrees of freedom

Multiple R-squared:0.9712, Adjusted R-squared: 0.9688

F-statistic: 405.1 on11 and 132 DF, p-value: < 2.2e-16

這裡2月份係數表明了一月份平均氣溫與二月份平均氣溫的差異，以此類推。

在介紹一下一個季節模型：餘弦趨勢μ1=βcos（2pi*f*t+φ）

還是考慮上面氣溫的例子：

驗證：

har<-harmonic(tempdub,1)

model2<-lm(tempdub~har)

summary(model2)

看看結果：

Call:

lm(formula = tempdub ~har)

Residuals:

Min 1Q Median 3Q Max

-11.1580 -2.2756 -0.1457 2.3754 11.2671

Coefficients:

Estimate Std. Error t valuePr(>|t|)

(Intercept) 46.2660 0.3088 149.816 < 2e-16 ***

harcos(2*pi*t)-26.7079 0.4367 -61.154 < 2e-16 ***

harsin(2*pi*t) -2.1697 0.4367 -4.968 1.93e-06 ***

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’1

Residual standarderror: 3.706 on 141 degrees of freedom

Multiple R-squared:0.9639, Adjusted R-squared: 0.9634

F-statistic: 1882 on 2 and 141 DF, p-value: < 2.2e-16

我們可以作圖來看擬合效果：

順便指出季節模型也可以模擬：比如μ1=βcos（2pi*f*t+φ）模型可以模擬如下：

t<-1:500

w<-rnorm(500)

c<-2*cos(2*pi*t/50+0.6*pi+w)

三、自相關與偏自相關

我們可以根據定義給出自相關係數（ACF）的演算法：

例如資料：

> x<-1:10

>u<-mean(x)

>v<-var(x)

>sum((x[1:9]-u)*(x[2:10]-u))/(9*v) #延遲1

[1] 0.7

>sum((x[1:8]-u)*(x[3:10]-u))/(9*v) #延遲2

[1]0.4121212

>sum((x[1:7]-u)*(x[4:10]-u))/(9*v) #延遲3

[1]0.1484848

在R中也提供了直接計算acf的函式acf（），利用該函式也計算1至3階的acf，結果如下：

>a<-acf(x,3)

> a

Autocorrelationsof series ‘x’, by lag

0 1 2 3

1.0000.700 0.412 0.148

可以看出，是一樣的。

利用acf（）可以處理很多階的acf，以太陽黑子數的資料集做例子：

>data(sunspots)

>acf(sunspots) #給出了相應的圖形

>a<-acf(sunspots,6) #為下面做估計做鋪墊，列出前6階的acf

> a

Autocorrelationsof series ‘sunspots’, by lag

0.00000.0833 0.1667 0.2500 0.3333 0.4167 0.5000

1.000 0.922 0.890 0.875 0.864 0.850 0.836

偏自相關：

對於一個平穩AR(p)模型，求出滯後k自相關係數p(k)時，實際上得到並不是x(t)與x(t-k)之間單純的相關關係。因為x(t)同時還會受到中間k-1個隨機變數x(t-1)、x(t-2)、……、x(t-k+1)的影響，而這k-1個隨機變數又都和x(t-k)具有相關關係，所以自相關係數p(k)裡實際摻雜了其他變數對x(t)與x(t-k)的影響。

為了能單純測度x(t-k)對x(t)的影響，引進偏自相關係數的概念。

對於平穩時間序列{x(t)}，用數學語言描述就是：

　　p[(x(t),x(t-k)]|(x(t-1),……，x(t-k+1)={E[(x(t)-Ex(t)][x(t-k)-Ex(t-k)]}/E{[x(t-k)-Ex(t-k)]^2}

這就是滯後k偏自相關係數的定義。

總之，偏自相關就是在試圖解釋在剔除了中間k-1個隨機變數x(t-1)、x(t-2)、……、x(t-k+1)的干擾之後，x(t-k)對x(t)影響的相關程度。

在R語言中，使用函式PACF（）可求解

還是使用太陽黑子數的例子：

> b<-pacf(sunspots,6)

> b

Partial autocorrelations of series ‘sunspots’, bylag

0.0833 0.1667 0.2500 0.3333 0.4167 0.5000

0.922 0.272 0.189 0.135 0.064 0.044

最後，我們利用這兩個函式來看看AR（p）,MA(q)的自相關函式與偏自相關函式的截尾性與拖尾性。

利用二中所介紹的方法生成AR（2），MA（2）的資料。

AR（2）模型：

w<-rnorm(550)#我們假定白噪聲的分佈是正態的。

x<-filter(w,filter=c(1,-0.9),"recursive")

MA(3)模型：

w<-rnorm(500)

v<-filter(w,sides=2,rep(1,3)/3)

> qq<-pacf(x,5)

> qq

Partial autocorrelations of series ‘x’, by lag

1 2 3 4 5

0.532-0.861 -0.082 0.000

可以看出AR（2）模型的偏自相關函式是截尾的（但由於這個是資料，所以出現pacf只能看出趨勢，而不是在2步後直接變為0）

對於MA（3）模型的自相關函式，由於v的第一項與最後一項缺失，不妨擷取v的一部分資料，命名為a,有：

> y<-acf(a,5)

> y

Autocorrelations of series ‘a’, by lag

0 1 2 3 4 5

1.000 0.652 0.397 0.059 0.067 0.035

也可以看出趨勢。

關於給出模型後的引數估計，我們將在下一篇博文中討論。

R語言與時間序列學習筆記（1）

今天分享的是R語言中時間序列的有關內容。主要有：時間序列的建立，ARMA模型的建立與自相關和偏自相關函式。一、時間序列的建立時間序列的建立函式為：ts().函式的引數列表如下： ts(data = NA, start = 1, end

R語言與時間序列學習筆記（2）

ARMA模型的引數估計方法 ARMA引數估計和前面我們介紹的點估計內容相似，也介紹矩估計與最小二乘估計兩種方法。和上一次的點估計一樣，這一次我分享的內容主要有：矩估計，最小二乘估計，一個應用例題關

R語言與點估計學習筆記（刀切法與最小二乘估計）

一、刀切法（jackknife）刀切法的提出，是基於點估計準則無偏性。刀切法的作用就是不斷地壓縮偏差。但需要指出的是縮小偏差並不是一個好的辦法，因為偏差趨於0時，均方誤差會變得十分大。而且無偏性只有在大量重複時才會表現出與真值的偏差不大。Ja

R語言與點估計學習筆記（EM演算法與Bootstrap法）

一、EM演算法 EM演算法是一種在觀測到資料後，用迭代法估計未知引數的方法。可以證明EM演算法得到的序列是穩定單調遞增的。這種演算法對於截尾資料或引數中有一些我們不感興趣的引數時特別有效。 EM演算法的步驟為： E-step（求期望）：在給定

R語言與迴歸分析學習筆記（bootstrap method）

Bootstrap方法在之前的博文《R語言與點估計學習筆記（EM演算法與Bootstrap法）》裡有提到過，簡而言之，bootstrap方法就是重抽樣。為什麼需要bootstrap方法呢？因為bootstrap方法使得我們無需分佈理論的知識也可以進行假

R語言與點估計學習筆記（矩估計與MLE）

眾所周知，R語言是個不錯的統計軟體。今天分享一下利用R語言做點估計的內容。主要有：矩估計、極大似然估計、EM演算法、最小二乘估計、刀切法（Jackknife）、自助法（Bootstrap）的相關內容。點估計是引數估計的一個組成部分。

《信用風險評分卡研究——基於SAS的開發與實施》學習筆記（1）

所有模型都要進行前期資料準備工作。在此，假設所有資料都已經準備完畢。注：該系列文章都是學習馬姆杜雷法特著的《信用風險評分卡研究——基於SAS的開發與實施》一書時的學習記錄和練手，供以後自己檢視。畢竟，。如有不準確或不清楚的地方，請查詢原著。 WOE證據權重法 1.

Python時間序列LSTM預測系列學習筆記（1）-單變數

本文是對： https://machinelearningmastery.com/time-series-forecasting-long-short-term-memory-network-python/ https://blog.csdn.net/iyangdi/article/deta

R語言學習筆記,（1）基礎及向量操作

一、基礎部分（持續更新） 1、大小寫明感 2、source（“d:/test.R”）：可以執行對應目錄下得test.R指令碼。R中\符號為轉義字元，所有目錄中需使用/或者\\.。 3、sink（“d:/out.txt”）：將後續的輸出由終端轉向一個外部檔案，本例中為d;/o

商務數據分析報告--R語言--學習筆記（1）-- ggplot2畫圖

商務分享數據分析開始 lib r語言都市生存 pla 如今是只大三狗，做事3分鐘熱度。可以讀書的時間就僅剩下不到4個月的時間。不想落到無書可讀可的地步，還沒有一門生存下去的手段。故開始記錄學習筆記，希望能在都市存活，繁衍。語言可視化是讓人理解的一個重要手段，也

JAVA學習筆記（1）——a++與++a的區別

col int 演示 opera 解析代碼數據 ++i div 需求：此博客用於解釋i++與++i的區別。過程： 1、名稱解釋 ++：自增，即在原有數據基礎上+1，再賦給原有數據。 2、程序演示（1）代碼： 1 class OperateDemo 2 { 3

Nordic nRF52832 學習筆記（1）介紹，入門，與準備工作

例程盜版 path pdf 規範準備但是依然可能　　近來，物聯網已成為大勢所趨，VR與AR正方興未艾，各種手環、遙控、智能家居也在粉墨登場。技術前沿的領航者們已經快馬加鞭，各種意誌與暗示也在上傳下達。物聯網，無線通訊，移動互聯，將成為新的目標與寵兒。最近開的電賽

Hibernate學習筆記（1）---hibernate快速上手與準備工作

成了 -- 開源工作快速 tar ref orm 磁盤持久層介紹持久化：將內存中的數據保存在磁盤等存儲設備中。持久化對象：指已經存儲在數據庫護著磁盤的業務對象經典的軟件應用體系結構（三層結構）在三層結構中，由於業務邏輯除了負責業務邏輯以外，還要負責相關的數據

公鑰與證書服務---學習筆記（預習）

公鑰與證書服務一·PKI技術PKI：是一種新的安全技術二·PKI組成： (1) 公鑰密碼技術：不同的非對稱密碼學，具有兩個密鑰，一個是公鑰一個是私鑰，它們具有這種性質：用公鑰加密的文件只能用私鑰解密，而私鑰加密的文件只能用公鑰解密。公鑰顧名思義是公開的，所有的人都可以得到它；私鑰也顧名思義是私有的，不應被其

Redis學習筆記（1）：Redis的說明與安裝

sets cti ansi c sde pos AR bsd 學習 ash Redis學習筆記（1）：Redis說明的安裝說明什麽是Redis REmote DIctionary Server(Redis) 是一個由Salvatore Sanfilippo寫的key-v

Go語言學習筆記（1）——順序編程

寫法 AR [] 多重賦值返回值賦值表達 div long Go語言學習筆記這一堆主要是《Go語言編程》（人民郵電出版社）的讀書筆記。中間會穿插一些零碎的點，比如源碼學習之類的。大概就是這樣吧。 1. 順序編程 1.1 變量變量的聲明： var 變量名類型 va

SOC中的DFT和BIST對比與比較-IC學習筆記（二）

獨立讀取 c學習連接特殊客戶服務 bsp design 來源 ATE：ATE是Automatic Test Equipment的縮寫，根據客戶的測試要求、圖紙及參考方案，采用MCU、PLC、PC基於VB、VC開發平臺，利用TestStand&LabV

【Java】「深入理解Java虛擬機器」學習筆記（1） - Java語言發展趨勢

這本書寫的比較早，現在這些功能都已經不同程度的實現了。 1、模組化　　　　JDK9之前的版本都是一個整體，使用者可能只需要使用一個小功能，但他不得不下載整個JDK。不能滿足定製化需求，顯然Java語言的發展因此大大受限。　　所以，Sun公司在OpenJDK建立了一個Jigsaw（拼圖）的專案來推動模

RabbitMQ學習筆記（1）----RabbitMQ簡介與安裝

·1. 什麼是RabbitMQ？　　RabbitMQ是流行的開源訊息佇列系統，用erlang語言開發。RabbitMQ是AMQP（高階訊息佇列協議）的標準實現。　　而AMQP協議則是指：即Advanced Message Queuing Protocol,一個提供統一訊息服務的應用層標準高階訊息佇列協

Go語言學習筆記（1）——入門

GO語言的基礎部分包括以下幾個成分：包宣告引入包函式變數語句&表示式註釋一個簡單的go程式例子如下： package main //包名 import "fmt" //輸出包名,fmt包是實現了格式化IO的函式

R語言與時間序列學習筆記（1）

相關推薦