利用python對2012美國大選進行資料分析(四,時間處理)
阿新 • • 發佈:2018-12-12
1,str轉datetime
我們可以使用pd.to_datetime(series,format='%Y%m%d')將字元轉化為日期,格式為年月日。
data_vs['time'] = pd.to_datetime(data_vs['contb_receipt_dt'])
3 重取樣和頻度轉換
重取樣(Resampling)指的是把時間序列的頻度變為另一個頻度的過程。把高頻度的資料變為低頻度叫做降取樣(downsampling),resample會對資料進行分組,然後再呼叫聚合函式。這裡我們把頻率從每日轉換為每月,屬於高頻轉低頻的降取樣。
vs_time = data_vs.groupby('cand_nm').resample('M')['cand_nm'].count() vs_time.unstack(0) print(vs_time)
我們用面積圖把11年4月-12年4月兩位總統候選人接受的贊助筆數做個對比可以看出,越臨近競選,大家贊助的熱情越高漲,奧巴馬在各個時段都佔據絕對的優勢
fig1, ax1=plt.subplots(figsize=(32, 8))
vs_time.unstack(0).plot(kind='area', ax=ax1, alpha=0.6)
plt.show()