1. 程式人生 > >數據分析師---目錄(待補充)

數據分析師---目錄(待補充)

離散 對比分析 理解 num 合並 缺失 折線 通用函數 國內

基礎知識

數值類型
序列(list,tuple,str),通用技巧和核心基本技巧
dist,常用操作,訪問及遍歷
條件循環語句和條件語句
自定義函數
局部變量和全局變量
匿名函數lambda
模塊創建及import指令運用,pip管理工具

文件對象申明及其操作
系統模塊下路徑操作
文件讀寫
pickle模塊運用及存儲結構化數據


工具

numpy基礎數據結構
通用函數
索引及切片
隨機數
數據輸入和輸出(存儲處理矩陣結構理解數組對象array)

Pandas
數據結構series,基本概念和創建
Series 索引
series基本技巧
Dataframe 基本概念和創建
索引
基本技巧
時間模塊
時刻數據
時間戳索引
數值計算和統計基礎
文本數據
合並
鏈接和修補
去重和替換
數據分組
分組轉換及拆分-應用-合並
透視表及交叉表
文件讀取

Matplotlib
圖表窗口
圖表的基本元素
圖表的樣式參數
刻度、註釋、圖表輸出胡
子圖
基本表繪制
柱狀圖、堆疊圖、面積圖、填圖、餅圖
直方圖、散點圖、矩陣散點圖
極坐標、箱型圖
表格樣式創建、顯示控制、樣式調用

國內外公開數據庫介紹


統計學知識

特征分析:
分布分析
對比分析
統計分析
帕累托分析
正態性檢驗
相關性分析

數據處理: 缺失值處理
異常值處理
數據歸一化
數據連續屬性離散化

數學建模:
線性回歸理論
線性回歸Python實現
線性回歸模型評估
KNN最鄰近分類
KNNpython實現
PCA主成分分析及實現
Kmeans聚類概述即實現
蒙塔卡羅模擬尼倫概述解毒


結果輸出

數據可視化技能體系及其方向
數據圖表表達的邏輯原理

python-seaborn 數據可視化
調色盤
分布數據可視化:直方圖和密度圖
散點圖
分類散點圖
分布圖
統計圖
線性數據可視化:
時間線圖、熱圖
結構化圖表可視化

關系網絡數據可視化
gephi軟件安裝和配置
python數據預處理
案例分析:公司職員關系圖表

空間可視化
3D圖表
空間柱狀圖
空間線性軌跡圖
空間熱力圖

python交互圖表可視化:bokeh
繪圖空間基本操作
圖表輔助參數設置
散點圖
折線圖、面積圖
柱狀圖、堆疊圖、直方圖
toolbar工具欄設置

數據分析師---目錄(待補充)