1. 程式人生 > >機器學習 第九期

機器學習 第九期

預習階段 機器學習中的數學基礎

微積分

  • 知識點1:微積分的基本概念

概率論

  • 知識點1:概率論簡介

線性代數

  • 知識點1:線性代數基礎

凸優化

  • 知識點1:凸優化簡介

第一階段 掌握基本模型 開啟ML大門

  • 知識點1:線性迴歸
  • 知識點2:logistic迴歸
  • 知識點3:梯度下降
  • 知識點4:實際工程海量資料下的logistic迴歸使用
  • 實戰專案:分佈擬合與迴歸、用LR分類與概率預測
  • 實戰專案:用LR完成Kaggle比賽邁開第一步
  • 知識點1:不同型別的分類樹模型
  • 知識點2:決策樹迴歸
  • 知識點3:樹模型過擬合與優化
  • 知識點4:使用隨機森林進行資料分類
  • 知識點5:Bagging
  • 知識點6:隨機森林
  • 實戰專案:信用卡欺詐檢測
  • 知識點1:線性可分支援向量機、線性支援向量機
  • 知識點2:非線性支援向量機
  • 知識點3:SMO
  • 實戰專案:使用SVM進行資料分類
  • 知識點1:熵、相對熵、資訊增益
  • 知識點2:最大熵模型、IIS、GMM

第二階段 重中之重 特徵工程

  • 知識點1:資料清洗、異常點處理
  • 知識點2:特徵抽取、選擇與組合策略
  • 實戰專案:特徵處理與特徵選擇模板
  • 知識點1:機器學習問題場景分析、演算法選擇
  • 知識點2:模型構建、模型效能分析與優化策略
  • 實戰專案:構建模型組合策略工具與模板

第三階段 工業實戰 在實戰中掌握一切

  • 知識點1:sklearn板塊介紹
  • 知識點2:sklearn完成資料預處理與特徵工程
  • 知識點3:建模流水線搭建
  • 實戰專案:經典Titanic案例,商品銷量預測案例等
  • 知識點1:xgboost使用方法與高階功能
  • 知識點2:lightGBM使用方法與高階功能
  • 實戰專案: Titanic與商品銷量預測進階,Kaggle案例實戰
  • 知識點1:推薦系統與評估
  • 知識點2:基於內容的推薦
  • 知識點3:基於近鄰的推薦--協同過濾
  • 知識點4:隱語義模型
  • 實戰專案:從頭手寫搭建協同過濾與隱語義模型推薦
  • 實戰專案:基於scikit-surprise的推薦系統
  • 知識點1:K-means/K-Medoid
  • 知識點2:層次聚類
  • 知識點3:GMM
  • 實戰專案:K-means/GMM程式碼實現和實際應用分析
  • 實戰專案:基於使用者聚類的推薦系統
  • 實戰專案:推薦系統比賽案例(資料、程式碼)

第四階段 高階知識 深入機器學習

  • 知識點1:樸素貝葉斯
  • 知識點2:有向分離
  • 知識點3:馬爾科夫模型
  • 知識點1:概率計算問題
  • 知識點2:引數學習問題
  • 知識點3:狀態預測問題
  • 實戰專案:使用HMM進行中文分詞
  • 知識點1:pLSA
  • 知識點2:共軛先驗分佈
  • 知識點3:LDA
  • 實戰專案:使用LDA進行文件分類

第五階段 邁入深度學習 開啟DL大門

  • 知識點1:全連線神經網路
  • 知識點2:反向傳播演算法與權重優化
  • 知識點3:訓練注意點
  • 知識點4:通用混合神經網路模板
  • 實戰專案:手寫神經網路解決非線性切分問題
  • 知識點1:卷積神經網路結構分析
  • 知識點2:過擬合與隨機失活
  • 知識點3:卷積神經網路理解
  • 知識點4:典型網路結構詳解
  • 實戰專案:利用ResNet與inception解決一般影象分類問題套路
  • 知識點1:迴圈神經網路
  • 知識點2:長時依賴問題與長短時記憶網路
  • 知識點3:BPTT演算法
  • 實戰專案:利用迴圈神經網路生成文字作詩
  • 知識點1:Caffe應用要點
  • 知識點2:TensorFlow/Keras簡介
  • 實戰專案:用神經網路完成影象分類與特徵提取
  • 實戰專案:用Keras構建文字情感分析模型