1. 程式人生 > >大資料學習線路圖,Python/資料分析實戰基礎

大資料學習線路圖,Python/資料分析實戰基礎

本文主要歸納Python、資料分析的學習線路圖,學習方向:

共分為五大板塊:

板塊一:熟悉python,SQL

python

(1)python語法

(2)常用資料結構(列表、元組、字典)

(3)python高階用法(日期和時間、列表推導式、高階函式、多執行緒)

SQL

(1)聚合

(2)表連線

(3)子查詢

板塊二:機器學習基本演算法入門

(1)機器學習基本概念(樣本、標籤、特徵、訓練集、測試集、分類、聚類、迴歸)

(2)基本分類演算法(決策樹、線性模型、貝葉斯模型等)

(3)整合學習(bagging、boosting等)

參考資料:周志華:《機器學習》,清華大學出版社,2016

板塊三:sklearn、pandas

(1)pandas基本函式使用

(2)sklearn 5個分類演算法呼叫,引數設定,交叉驗證評估

(3)sklearn單機特徵工程、特徵選擇與聚類演算法呼叫

板塊四:資料分析進階(天池新手賽)

賽題地址:天池新手賽

(1)資料劃分(訓練集,驗證集,測試集)

(2)提取特徵(不少於50個)

板塊五:資料分析實戰(天池新手賽)

生活大實惠:O2O優惠券使用預測

在後面的學習中,我會分享一些自己總結的學習資料

文章由資料實驗室原創,轉載請註明來源