Python數據分析+Kaggle案例培訓課程 含課件代碼
課程概述:
近年來,數據分析師的需求非常大,90%的崗位技能需要掌握Python作為數據分析工具。
Python語言的易學性、快速開發,擁有豐富強大的擴展庫和成熟的框架等特性很好地滿足了數據分析師的職業技能要求。
本課程以案例驅動的方式講解如何利用Python完成數據獲取、處理、數據分析及可視化方面常用的數據分析方法與技巧。
每章節都會引入Kaggle的項目和數據集,通過這些實際案例讓學員輕松掌握使用Python分析來自不同領域的數據,隨課代碼及案例代碼均會提供給學員自行實操。
適用人群:
-
想了解和學習典型的數據分析流程和實踐方法的人
-
不會使用Python的數據分析師從業者
-
想轉行從事數據分析師行業的朋友
- 想使用Python實現機器學習的工程師
課程目標:
-
熟悉數據分析的流程,包括數據采集、處理、可視化等
-
掌握Python語言作為數據分析工具,從而有能力駕馭不同領域的數據分析實踐
-
快速積累多個業務領域的數據分析項目經驗
- 掌握使用Python實現基於機器學習的數據分析和預測
課程大綱:
第一課 工作環境準備及Python數據結構講解 (2小時)
課程介紹、工作環境準備、Python語言基礎回顧、Python數據結構講解
列表、字典、元組、集合、Python高級特性、切片、叠代、Python高階函數、map、filter、reduce
第二課 科學計算及數據可視化入門 (2小時)
使用NumPy和SciPy進行科學計算、Matplotlib繪圖入門、實戰案例:2016美國總統大選數據分析 (2016 Election Polls)
第三課 本地數據的采集與操作 (2小時)
常用格式的本地數據讀寫、SQL常用語法講解、Python的數據庫基本操作、數據庫多表連接用法詳解
left join、right join、inner join
實戰案例:歐洲職業足球數據庫分析 (European Soccer Database)
第四課 網絡數據的獲取與表示 (2小時)
BeautifulSoup解析網頁
爬蟲框架Scrapy基礎
實戰案例:獲取電商網站的商品信息
第五課 數據分析工具Pandas 基礎 (2小時)
Pandas的數據結構、Series、DataFrame、Pandas的數據操作、數據的導入、導出
數據的過濾篩選、索引及多重索引、Pandas統計計算和描述、Pandas的繪圖函數
實戰案例:星級爭霸II重放分析 (StarCraft II Replay Analysis)
第六課 數據分析工具Pandas進階 (2小時)
數據的分組與聚合
數據的分組運算
Pandas透視表和交叉表
實戰案例:互聯網電影資料庫分析 (IMDB 5000 Movie Dataset)
第七課 數據的規整與可視化 (2小時)
數據清洗、合並、轉化和重構
常用的Python數據可視化工具
Matplotlib回顧及擴充
Seaborn繪圖
交互式數據可視化—Bokeh繪圖
實戰案例:空難歷史數據分析 (Airplane Crashes Since 1908)
第八課 機器學習基礎及機器學習庫scikit-learn入門 (2小時)
機器學習基礎
scikit-learn入門
實戰案例:利用聲音數據進行性別識別 (Gender Recognition by Voice)
第九課 項目實戰:“閃電約會”配對預測 (2小時)
項目介紹 (Speed Dating Experiment)
數據分析與處理
模型選擇及訓練
課程總結
Python數據分析+Kaggle案例培訓課程 含課件代碼