Python時間序列處理之datetime與pandas模組

阿新 • • 發佈：2019-02-15

每次遇到時間型別的資料做處理的時候，我會非常頭疼，我忍無可忍之下決定硬著頭皮學習一下，發現也不是很複雜，掌握一些基礎方法就可以做，下面我將一一介紹這些有效的方法。

datetime模組

#匯入datetime包
import datetime

#獲取當前時間
now = datetime.now()
print(now)

#格式化輸出一下
print('年: {}, 月: {}, 日: {}'.format(now.year, now.month, now.day))

#算時間差
diff = datetime(2018, 8, 20, 17) - datetime(2017, 7, 20 
, 15)
print(diff)

字串和datetime轉換

#datetime轉string
dt_obj = datetime(2018, 8, 20)
str_obj = str(dt_obj)
print(type(str_obj))
print(str_obj)

#string轉datetime
dt_str = '2018-08-20'
dt_obj2 = datetime.strptime(dt_str, '%Y-%m-%d')#必須是這種形式否則會報錯
print(type(dt_obj2))
print(dt_obj2)

dateutil解析

#匯入包
from dateutil.parser import parse
dt_str2 = '2018/08/20' 
#可以是各種可以被解析的格式
dt_obj3 = parse(dt_str2)
print(type(dt_obj3))
print(dt_obj3)

pandas的datetime

#將一組轉化為時間型別
import pandas as pd
s_obj = pd.Series(['2018/08/18', '2018/08/19', '2018-08-25', '2018-08-26'])
s_obj2 = pd.to_datetime(s_obj)
print(s_obj2)

pandas的時間序列處理

#匯入包
from datetime import datetime
import pandas as pd
import numpy as np

#將index變為datetime的列表形式(這樣會讓處理變得十分方便） 

date_list = [datetime(2018, 2, 18), datetime(2018, 2, 19), 
             datetime(2018, 2, 25), datetime(2018, 2, 26), 
             datetime(2018, 3, 4), datetime(2018, 3, 5)]
time_s = pd.Series(np.random.randn(len(date_list)), index=date_list)
print(times_s)

#pd.date_range()生成一組日期
dates = pd.date_range('2018-08-18', # 起始日期
                      periods=5,    # 週期
                      freq='W-SAT') # 頻率(週六開始）
print(dates)
print(pd.Series(np.random.randn(5), index=dates))

#索引，index為時間之後，索引變得很方便
#傳入可被解析的字串
print(time_s['2018/08/18'])
#傳入年月
print(time_s['2018-8'])

#切片與過濾
print(time_s['2018-8-19':])

print(time_s.truncate(before='2018-8-20'))
print(time_s.truncate(after='2017-8-20'))

#還可以這樣生成日期
time = pd.date_range('2018/08/18', '2018/08/28', freq='2D')#freq是頻率，2D代表兩天，可以3D,5D......

#shift移動資料
ts = pd.Series(np.random.randn(5), index=pd.date_range('20180818', periods=5, freq='W-SAT'))
print(ts)
#後移
print(ts.shift(1))
#前移
print(ts.shift(-1))

時間資料重取樣resample（重點）

import pandas as pd
import numpy as np

#資料生成
date_rng = pd.date_range('20180101', periods=100, freq='D')
ser_obj = pd.Series(range(len(date_rng)), index=date_rng)
print(ser_obj.head(10))

#按月求和
resample_month_sum = ser_obj.resample('M').sum()
#按月求平均
resample_month_sum = ser_obj.resample('M').mean()
print(resample_month_sum)
#還可以按5天或者10天......
resample_month_sum = ser_obj.resample('5D').sum()
resample_month_sum = ser_obj.resample('10D').mean()

#以上做的其實是降取樣，也就是將長時間間隔變為短的來處理一些資料，比如從月為間隔變為天為間隔，進行求和平均等待，其實還可升取樣，但是會存在缺失資料的問題，可以通過一些方式來彌補缺失資料。

#升取樣以及缺失資料處理
#按周生成資料
df = pd.DataFrame(np.random.randn(5, 3),
                 index=pd.date_range('20180101', periods=5, freq='W-MON'),
                 columns=['S1', 'S2', 'S3'])
print(df)
#按天升取樣
print(df.resample('D').asfreq())
#前補資料，將缺失資料補全為前面的資料
print(df.resample('D').ffill(2))#補兩個，不指定數字全補全
#後補
print(df.resample('D').bfill())
#擬合補資料
print(df.resample('D').fillna('ffill'))#做線性擬合

時間序列資料統計——滑動視窗

import pandas as pd
import numpy as np

#生成資料
ser_obj = pd.Series(np.random.randn(1000), 
                    index=pd.date_range('20180101', periods=1000))
ser_obj = ser_obj.cumsum()#累加
print(ser_obj.head())

#rolling滑動
r_obj = ser_obj.rolling(window=5)#視窗為5
print(r_obj)
print(r_obj.mean())#求均值，即第五個資料是前五個資料的均值，以此類推

# 畫圖檢視
import matplotlib.pyplot as plt

#pandas直接plot，很方便，index預設是x，這也能看出index設定為時間序列的好處
ser_obj.plot(style='r--')
ser_obj.rolling(window=10).mean().plot(style='b')
plt.show()

ok，以上就是分析時序資料的一些常用的方法，希望給讀者帶來幫助。

Python時間序列處理之datetime與pandas模組

每次遇到時間型別的資料做處理的時候，我會非常頭疼，我忍無可忍之下決定硬著頭皮學習一下，發現也不是很複雜，掌握一些基礎方法就可以做，下面我將一一介紹這些有效的方法。 datetime模組 #匯入datetime包 import datetime #獲取當

Python時間日期格式化之time與datetime模組總結

1 引言 2 理論準備 3 time模組 4 timedate模組　　4.1 date類　　4.2 time類　　4.3 datetime類　　4.4 datedelta類 1 引言　　在實際開發過程中，我們經常會用到日期或者時間，那麼在Python中我們怎麼獲取時間，以及如何將時

Python時間日期格式化之time與datetime模組總結！

1 引言 2 理論準備 3 time模組 4 timedate模組 4.1 date類 4.2 time類 4.3 datetime類 4.4 datedelta類 1 引言在實際開發過程中，我們經常會用到日期或者時間，那麼在Python中我們怎麼獲取時間，以及

[python] 時間序列分析之ARIMA

1 時間序列與時間序列分析在生產和科學研究中，對某一個或者一組變數 x(t) 進行觀察測量，將在一系列時刻 t1,t2,⋯,tn 所得到的離散數字組成的序列集合，稱之為時間序列。時間序列分析是根據系統觀察得到的時間序列資料，通過曲線擬合和引數估計來建立數

python 時間序列分析之ARIMA

1 時間序列與時間序列分析在生產和科學研究中，對某一個或者一組變數 x(t) 進行觀察測量，將在一系列時刻 t1,t2,⋯,tn 所得到的離散數字組成的序列集合，稱之為時間序列。時間序列分析是根據系統觀察得到的時間序列資料，通過曲線擬合和引數估計來建立數學模型的理

Python 資料集處理之連線與追加

以下內容轉自數析學院，原文後續還有關於索引值在合併過程中的處理，需要學習的同學可以直接檢視原文向大家介紹資料集合並方法中的連線（concat）與追加（append），首先做一些準備工作： 1.匯入 Pandas 庫與 Numpy 庫： import

python+pandas+時間、日期以及時間序列處理

先簡單的瞭解下日期和時間資料型別及工具 python標準庫包含於日期（date）和時間（time）資料的資料型別，datetime、time以及calendar模組會被經常用到。 datetime以毫秒形式儲存日期和時間，datetime.timedelta

Pandas時間序列處理

1、建立 from datetime import datetime import pandas as pd import numpy as np # 指定index為datetime的list date_list = [datetime(2018, 3

python資料處理之numpy和pandas（上）

import numpy as np a = np.random.random((2,4)) print(a) print(np.sum(a)) print(np.max(a)) print(np.min(a)) print(np.sum(a,axis=1)) print(np.min(a,axis=0))

Python資料分析與機器學習-Python時間序列分析

原始碼下載地址： http://download.csdn.net/download/adam_zs/10224873 from __future__ import absolute_import, division, print_function # http://w

Python時間序列缺失值處理（日期缺失填充）完全教程-附Python完整例程

前言因近期進行時間序列分析時遇到了資料預處理中的缺失值處理問題，其中日期缺失和填充在網上沒有找到較好較全資料，耗費了我一晚上工作時間，所以下面我對這次時間序列缺失值處理學習做了以下小結以供之後同行們參考指正。時間序列缺失值處理一、程式設計前準備

2017.06.9 金融時間序列分析之Eview使用基礎

file 打開操作 span bject 生成 com 工作表時間序列分析一.創建時間序列工作文件：首先將數據轉換為Eviews系統能夠分析的Eviews Workfile數據集 1.創建工作文件：工作文件結構類型：非結構/非日期型；日期-規則頻率型；平衡面板型；

Python時間模塊之Time模塊解析

可選去掉說明協調 all strong haml repr ecs 在我們平常的代碼中，經常需要和時間打交道。在Python中，與時間處理相關的模塊有：time、datetime以及calendar。學會計算時間，對程序的調優非常重要，可以在程序中狂打時間戳，來具體判

Python時間序列分析

單獨自己 line pandas mage lse atp 刻度 sta Pandas生成時間序列： import pandas as pd import numpy as np　　時間序列時間戳（timestamp）固定周期（period）時間間隔（int

Python面向對象之結構與成員

bim 使用 person %s 成員分析 true main sel 1.面向對象結構分析： ----面相對象整體大致分為兩塊區域： --------第一部分：靜態字段（靜態變量）部分 --------第二部分：方法部分 --每個大區域可以分為多個小部分： class

時間序列處理方法

code 相關 ima 數據讀取 pacf air 讀取 imp 數列時間序列處理方法 1、ARIMA模型ARIMA模型，是統計學中的常見對時間序列處理的模型，全稱為自回歸移動平均模型。ARIMA模型主要有p,d,q三個參數。 p--代表預測模型中采用的時序數據本身的滯

序列處理之seqinr（fetch）

cond ioc 多少 fast 序列 false conductor names 數據缺點：需要聯網，經常出錯，不是操作問題而是因為網絡問題安裝 if("seqinr" %in% rownames(installed.packages()) == FALSE) {s

R語言時間序列處理介紹--以A股財報資料處理為案例

本文以處理A股財務報表為例，介紹了將資料轉換成時間序列後在進行處理的一些方法和思路。將會用到xts，lapply，do.call等資料結構和函式。 1、簡介我們從各個途徑獲得了個股的財務報表原始資料後，還需要對資料做一些處理，以便後續指標計算和使用。舉個簡單的例子，

Python時間序列LSTM預測系列學習筆記（2）-單變數

本文是對： https://machinelearningmastery.com/time-series-forecasting-long-short-term-memory-network-python/ https://blog.csdn.net/iyangdi/article/deta

Python時間序列LSTM預測系列學習筆記（1）-單變數

本文是對： https://machinelearningmastery.com/time-series-forecasting-long-short-term-memory-network-python/ https://blog.csdn.net/iyangdi/article/deta

Python時間序列處理之datetime與pandas模組

datetime模組

字串和datetime轉換

dateutil解析

pandas的datetime

pandas的時間序列處理

時間資料重取樣resample（重點）

時間序列資料統計——滑動視窗

相關推薦