1. 程式人生 > >[讀書筆記] Python數據分析 (一) 準備工作

[讀書筆記] Python數據分析 (一) 準備工作

基礎 htm 環境 防止 功能 多維 處理工具 ati 增強

1. python中數據結構:矩陣,數組,數據框,通過關鍵列相互聯系的多個表(SQL主鍵,外鍵),時間序列

2. python 解釋型語言,程序員時間和CPU時間衡量,高頻交易系統

3. 全局解釋器鎖GIL, Global Interpreter Lock防止解釋器同時執行多個python字節碼指令的機制

Cpython 可以繼承OpenMP 實行並行處理循環而大幅度提高數值算法的速度

4. Numpy, pandas,matplotlib,Ipython,Scipy

Numpy:Python科學計算基礎庫,作為在算法之間傳遞數據的容器,Numpy數組比python內置數據結構更高效,低級語言如C可以直接操作Numpy數組中數據

  • 快速高效的多維數組對象ndarray
  • 對數組元素和數組整體進行數學運算
  • 用於讀寫硬盤上基於數組的數據集工具
  • 線性代數,傅裏葉變換,隨機數生成
  • C, C++, Fortran代碼集成到python工具

pandas:處理結構化數據的大量數據結構和函數

  • 精確的索引,重塑,切片,切塊,聚合,選取子集
  • 高性能時間序列功能和工具

matplotlib:最流行的繪制數據圖表的庫

Ipython:增強的Python Shell, 為交互式和探索式計算提供了一個強健和高效的環境

  • 交互式數據處理和繪圖
  • 類似於Mathematica 的HTML筆記本,通過Web瀏覽器連接Ipython
  • 基於Qt框架的GUI控制臺,含有繪圖,多行編輯,語法高亮
  • 交互式並行和分布式計算的基礎架構

Scipy:科學計算工具包

  • scipy.integrate: 數值積分和微分方程求解器
  • scipy.linalg: 擴展了由numpy.linalg提供的線性代數例程和矩陣分解
  • scipy.optimize: 函數優化器以及根查找算法
  • scipy.signal: 信號處理工具
  • scipy.sparse: 系數矩陣和系數線性系統求解
  • scipy.stats: 標準連續和離散概率分布,統計檢驗等
  • scipy.weave: 利用內聯C++代碼加速數組計算的工具

[讀書筆記] Python數據分析 (一) 準備工作