1. 程式人生 > >7-感覺身體被掏空,但還是要學Pandas(下)

7-感覺身體被掏空,但還是要學Pandas(下)

裏的 toe 時間序列 enc 分組 文件 mod 期待 都是

本周群主用了兩天時間為浙師大的《旅遊大數據分析師——Pandas數據清洗》課程備課,和Pandas來了一次深度親密接觸。現在做夢都是DataFrame變形:stack,unstack,pivot table……對Pandas有了全新的認識:原來它不只是提供類似表格的數據結構DataFrame這麽簡單,簡直就是Excel+SQL的集大成者!而且擁有Python如此優雅的語法,真的可以說是“微言大義”,“玄之又玄,眾妙之門”,“妙處難與君說”,此處省略1w字……(☆???)

上周介紹了Pandas中的兩種新的數據結構:Series(序列)和DataFrame(數據框),對於大型的數據集,比如存儲在CSV文件裏的數據,Pandas也提供了一系列完備的操作方法。還有時間序列,作為一種常用的索引,擁有豐富多變的函數。本次課簡單直接,一言不合啪啪貼代碼,請重點關註註釋部分,信息量很大。強烈建議用文件傳輸助手發送到PC端觀看,否則會因為眼瞎而厭學←_←

本節例子中的所有數據文件可在百度網盤下載:http://pan.baidu.com/s/1c9zL2e

3

操作大型數據集

技術分享

說明:

1)根據所讀取的數據文件編碼格式設置encoding參數,如”utf8”,”ansi”,”gbk”等編碼方式。

2)根據所讀取的數據文件列之間的分隔方式設置delimiter參數,大於1個字符的分隔符被看作正則表達式,如一個或多個空格:”\s+”,tab符號:”\t”等。

技術分享

技術分享

技術分享

技術分享

技術分享

技術分享

技術分享

技術分享

技術分享

技術分享

技術分享

4

時間序列

  • 基礎知識

技術分享

技術分享

  • 溫度vs時間序列例子

技術分享

技術分享

技術分享

  • 提取1月溫度數據

技術分享

技術分享

技術分享

  • 按月分組

技術分享

技術分享

兩次筆記無法涵蓋Pandas的所有博大精深,但都是重要+必要的知識點,足夠以後課程用了。現在我們一起翻越了兩座高山:Numpy和Pandas,對後面的旅程是否更加躊躇滿誌呢ヾ(o???)?下周將用matploblib進行數據可視化的探索,敬請期待……

7-感覺身體被掏空,但還是要學Pandas(下)