1. 程式人生 > >讀《利用 Python 進行資料分析》pdf

讀《利用 Python 進行資料分析》pdf

此篇文章沒有記錄什麼有價值的東西,只是列出了目錄。最近沒太多時間關注 python 了。
2013.9 Wes McKinney 著 2014.1 中文第一版,463頁,O'Reilly 第3章,IPython 開發環境 第4章,NumPy基礎 第5章,pandas入門 第6章,資料載入,儲存與檔案格式 第7章,資料規整化:清理、轉換、合併、重塑 第8章,繪圖和視覺化 第9章,資料聚合與分組運算 第10章,時間序列 第11章,金融和經濟資料應用 第12章,NumPy高階應用 附錄A Python語言精要 處理資料物件:結構化資料
  • 多維陣列(矩陣)
  • 表格型資料(各列欄位可能是字串,數值,日期等)或用製表符,逗號為分隔符的文字檔案
  • 通過關鍵列聯絡的多個表
  • 間隔平均或不平均的時間序列
不適合 Python 的場景 高頻交易系統對時間要求高。 高併發,多執行緒的應用程式。Python 有個叫全域性直譯器鎖(Global Interpreter Lock, GIL)防止直譯器同時執行多條 Python 位元組碼指令的機制。 PS
.Cython 專案可以整合 OpenMP (平行計算的 c 框架) NumPy (Numerical Python) 科學計算基礎包,功能:
  • 多維陣列物件 ndarray
  • 對陣列執行元素級計算及對陣列執行計算的函式
  • 讀寫硬碟上陣列的資料集的工具
  • 線性代數運算,傅立葉變換,隨機數生成
  • 將 c , c++, Fortran 程式碼整合到 Python 的工具。
c ,Fortran 編寫的庫可以直接操作 NumPy 陣列中的資料,無需進行任何資料複製工作。 pandas 資料分析功能,資料結構和函式支援。DataFrame 物件是面向列(column-oriented)的二維表結構,含有行標和列標。 panel data 面板資料,是計量經濟學中關於多維結構化資料集的一個術語。 20 page 網路資源: 妻子的微店,賣鐵皮石斛 等