1. 程式人生 > >Python3數據分析與挖掘建模實戰視頻

Python3數據分析與挖掘建模實戰視頻

特征工程 motion 數據分布 選擇 資料 hour 假設 人工 mean

第1章 課程介紹【贈送相關電子書+隨堂代碼】 本章首先介紹本課程是什麽,有什麽特色,能學習到什麽,內容如何安排,需要什麽基礎,是否適合學習這門課程等。然後對數據分析進行概述,讓大家對數據分析的含義和作用有一個整體的認知,讓大家對自己接下來要做的事情,有一個基本的概念與了解。... 1-1 課程導學 1-2 數據分析概述 第2章 數據獲取 數據從哪裏來?怎麽來?這一章,我們會介紹數據獲取的一般手段。主要包括數據倉庫、抓取、資料填寫、日誌、埋點、計算等手段。同時,我們也會介紹幾個常用的數據網站,供大家參考與學習。 2-1 數據倉庫 2-2 監測與抓取 2-3 填寫、埋點、日誌、計算 2-4 數據學習網站 第3章 單因子探索分析與數據可視化 有了數據,如何上手?這一章,我們會介紹探索分析的一部分---單因子探索分析和可視化的內容。我們會以基礎的統計理論知識為切入點,學習異常值分析、對比分析、結構分析、分布分析。同時,引入接下來幾章都會用到的案例-HR人力資源分析表,並用理論與可視化的方法,完成對此表的初步分析。... 3-1 數據案例介紹3-2 集中趨勢,離中趨勢3-3 數據分布--偏態與峰度3-4 抽樣理論3-5 編碼實現(基於python2.7)3-6 數據分類3-7 異常值分析3-8 對比分析3-9 結構分析3-10 分布分析3-11 Satisfaction Level的分析3-12 LastEvaluation的分析3-13 NumberProject的分析3-14 AverageMonthlyHours的分析3-15 TimeSpendCompany的分析3-16 WorkAccident的分析3-17 Left的分析3-18 PromotionLast5Years的分析3-19 Salary的分析3-20 Department的分析3-21 簡單對比分析操作3-22 可視化-柱狀圖3-23 可視化-直方圖3-24 可視化-箱線圖3-25 可視化-折線圖3-26 可視化-餅圖3-27 本章小結 第4章 多因子探索分析 上了手,然後呢?這一章,我們介紹探索分析的另一部分---多因子復合探索分析。我們同樣以基礎的統計知識為切入點,學習多因子間互相影響與配合的分析方法,如交叉分析、分組分析、相關分析、成分分析等。同時,以HR人力資源分析表為例,進行進一步的探索。... 4-1 假設檢驗 4-2 卡方檢驗 4-3 方差檢驗 4-4 相關系數 4-5 線性回歸 4-6 主成分分析 4-7 編碼實現 4-8 交叉分析方法與實現 4-9 分組分析方法與實現 4-10 相關分析與實現 4-11 因子分析與實現 4-12 本章小結 第5章 預處理理論 數據已了解,用起來!不著急,先加工。這一章,我們會介紹特征工程的主要內容,重點會介紹數據清洗和數據特征預處理的主要內容,包括數據清洗、特征獲取、特征處理(內含對指化、歸一化、標準化等)、特征降維、特征衍生。預處理的好壞,直接影響著接下來模型的效果。... 5-1 特征工程概述 5-2 數據樣本采集 5-3 異常值處理 5-4 標註 5-5 特征選擇 5-6 特征變換-對指化 5-7 特征變換-離散化 5-8 特征變換-歸一化與標準化 5-9 特征變換-數值化 5-10 特征變換-正規化 5-11 特征降維-LDA 5-12 特征衍生 5-13 HR表的特征預處理-1 5-14 HR表的特征預處理-2 5-15 本章小結 第6章 挖掘建模 把數據用起來!這一章,我們會介紹數據挖掘與建模的主要內容。主要包含五類模型的建立與實踐,分別為:分類模型(KNN、樸素貝葉斯、決策樹、SVM、集成方法、GBDT……),回歸模型與回歸思想分類(線性回歸、邏輯斯特回歸【也叫羅吉回歸,邏輯回歸。音譯區別】、神經網絡、回歸樹),聚類模型(K-means、DBSCAN、層次聚類、... 6-1 機器學習與數據建模 6-2 訓練集、驗證集、測試集 6-3 分類-KNN 6-4 分類-樸素貝葉斯 6-5 分類-決策樹 6-6 分類-支持向量機 6-7 分類-集成-隨機森林 6-8 分類-集成-Adaboost 6-9 回歸-線性回歸 6-10 回歸-分類-邏輯回歸 6-11 回歸-分類-人工神經網絡-1 6-12 回歸-分類-人工神經網絡-2 6-13 回歸-回歸樹與提升樹 6-14 聚類-Kmeans-1 6-15 聚類-Kmeans-2 6-16 聚類-DBSCAN 6-17 聚類-層次聚類 6-18 聚類-圖分裂 6-19 關聯-關聯規則-1 6-20 關聯-關聯規則-2 6-21 半監督-標簽傳播算法 6-22 本章小結 第7章 模型評估 哪個模型好?上一章,我們學習了很多模型,一個數據集,可能用多種模型都可以進行建模,那麽哪種模型好,就需要有些指標化的東西幫我們決策。這一章,我們會介紹使用混淆矩陣和相應的指標、ROC曲線與AUC值來評估分類模型;用MAE、MSE、R2來評估回歸模型;用RMS、輪廓系數來評估聚類模型。... 7-1 分類評估-混淆矩陣 7-2 分類評估-ROC、AUC、提升圖與KS圖 7-3 回歸評估 7-4 非監督評估 第8章 總結與展望 這一章,我們將回顧本課程的全部內容,並從多個角度,重新看待我們的數據分析工作。最後,我們會了解到,學習了這門課程以後,還可以在哪些方面進行發展。 8-1課程回顧與多角度看數據分析8-2大數據與學習這門課後還能幹什麽?

下載地址;百度網盤百度網盤下載

Python3數據分析與挖掘建模實戰視頻