1. 程式人生 > >利用python對2012美國大選進行資料分析(四,時間處理)

利用python對2012美國大選進行資料分析(四,時間處理)

1,str轉datetime

我們可以使用pd.to_datetime(series,format='%Y%m%d')將字元轉化為日期,格式為年月日。

data_vs['time'] = pd.to_datetime(data_vs['contb_receipt_dt'])

3 重取樣和頻度轉換

重取樣(Resampling)指的是把時間序列的頻度變為另一個頻度的過程。把高頻度的資料變為低頻度叫做降取樣(downsampling),resample會對資料進行分組,然後再呼叫聚合函式。這裡我們把頻率從每日轉換為每月,屬於高頻轉低頻的降取樣。

vs_time = data_vs.groupby('cand_nm').resample('M')['cand_nm'].count()
vs_time.unstack(0)
print(vs_time)

我們用面積圖把11年4月-12年4月兩位總統候選人接受的贊助筆數做個對比可以看出,越臨近競選,大家贊助的熱情越高漲,奧巴馬在各個時段都佔據絕對的優勢

fig1, ax1=plt.subplots(figsize=(32, 8))
vs_time.unstack(0).plot(kind='area', ax=ax1, alpha=0.6)
plt.show()