[讀書筆記] Python數據分析 (一) 準備工作
阿新 • • 發佈:2017-11-27
基礎 htm 環境 防止 功能 多維 處理工具 ati 增強
1. python中數據結構:矩陣,數組,數據框,通過關鍵列相互聯系的多個表(SQL主鍵,外鍵),時間序列
2. python 解釋型語言,程序員時間和CPU時間衡量,高頻交易系統
3. 全局解釋器鎖GIL, Global Interpreter Lock防止解釋器同時執行多個python字節碼指令的機制
Cpython 可以繼承OpenMP 實行並行處理循環而大幅度提高數值算法的速度
4. Numpy, pandas,matplotlib,Ipython,Scipy
Numpy:Python科學計算基礎庫,作為在算法之間傳遞數據的容器,Numpy數組比python內置數據結構更高效,低級語言如C可以直接操作Numpy數組中數據
- 快速高效的多維數組對象ndarray
- 對數組元素和數組整體進行數學運算
- 用於讀寫硬盤上基於數組的數據集工具
- 線性代數,傅裏葉變換,隨機數生成
- C, C++, Fortran代碼集成到python工具
pandas:處理結構化數據的大量數據結構和函數
- 精確的索引,重塑,切片,切塊,聚合,選取子集
- 高性能時間序列功能和工具
matplotlib:最流行的繪制數據圖表的庫
Ipython:增強的Python Shell, 為交互式和探索式計算提供了一個強健和高效的環境
- 交互式數據處理和繪圖
- 類似於Mathematica 的HTML筆記本,通過Web瀏覽器連接Ipython
- 基於Qt框架的GUI控制臺,含有繪圖,多行編輯,語法高亮
- 交互式並行和分布式計算的基礎架構
Scipy:科學計算工具包
- scipy.integrate: 數值積分和微分方程求解器
- scipy.linalg: 擴展了由numpy.linalg提供的線性代數例程和矩陣分解
- scipy.optimize: 函數優化器以及根查找算法
- scipy.signal: 信號處理工具
- scipy.sparse: 系數矩陣和系數線性系統求解
- scipy.stats: 標準連續和離散概率分布,統計檢驗等
- scipy.weave: 利用內聯C++代碼加速數組計算的工具
[讀書筆記] Python數據分析 (一) 準備工作