吳恩達-機器學習(10)-大資料集機器學習

阿新 • • 發佈：2018-12-19

文章目錄

Large Scale machine learning

Learning with large datasets
Stochastic Gradient Descent
Mini-Batch Gradient Descent
Stochastic Gradient Descent Convergence

Advanced Topics

Online Learning
Map-reduce and data parallelism

Large Scale machine learning

Learning with large datasets

當資料量非常的大的時候，我們應該從中選取少量的資料，使用我們的演算法進行計算，繪製學習曲線，如果學習曲線是左邊的時候說明演算法高方差，這時候提高資料量，就可以提高效能，如果是右邊的圖形，說明演算法高偏差，增加資料量並不會有什麼改變

Stochastic Gradient Descent

當資料量較大的時候，每一次梯度下降都會耗費大量的計算力，所以介紹隨機梯度下降
隨機梯度下降：

打亂資料
對單一的訓練樣本進行更新引數

Mini-Batch Gradient Descent

小批量隨機梯度下降介於梯度下降和隨機梯度下降之間，每次選取一定數量的樣本進行梯度下降

Stochastic Gradient Descent Convergence

只需要每次更新引數前計算損失
每一千次迭代，求最後1000樣本的損失的平均值，繪製圖像

使用隨機梯度下降，最終會在最小值附近波動
如果想要讓隨機梯度下降確實收斂到全域性最小值，可以隨著時間的變化減小學習率的值

Advanced Topics

Online Learning

當我們擁有連續的資料流，就可以使用演算法進行建模，並不斷的優化模型
以快遞公司為例，每當使用者訪問網站提交資料後，都會更新引數

其它例子

Map-reduce and data parallelism

在實際使用可能不是在一臺機器上執行機器學習演算法，這就需要了解Map-reduce
Map-reduce基本思想
在每臺機器上分別計算梯度，在結合在一起

只要演算法可以表示為訓練樣本的求和，就可以考慮使用map-reduce

吳恩達-機器學習(10)-大資料集機器學習

文章目錄

Large Scale machine learning

Learning with large datasets

Stochastic Gradient Descent

Mini-Batch Gradient Descent

Stochastic Gradient Descent Convergence

Advanced Topics

Online Learning

Map-reduce and data parallelism

吳恩達-機器學習(10)-大資料集機器學習

AI-005: 吳恩達教授（Andrew Ng）的機器學習課程學習筆記15-20

AI-004: 吳恩達教授（Andrew Ng）的機器學習課程學習筆記1-14

AI-009: 吳恩達教授（Andrew Ng）的機器學習課程學習筆記38-47

AI-008: 吳恩達教授（Andrew Ng）的機器學習課程學習筆記34-37

AI-007: 吳恩達教授（Andrew Ng）的機器學習課程學習筆記27-33

AI-014: 吳恩達教授（Andrew Ng）的機器學習課程學習筆記49

機器學習，大資料，深度學習競賽網站，學習網站，演算法刷題網站

吳恩達DeepLearning.ai（神經網路和深度學習）第二週程式設計作業

分享丨李飛飛、吳恩達、Bengio等人的頂級深度學習課程

吳恩達機器學習訓練祕籍整理三十六到四十三章（六）訓練資料

吳恩達機器學習邏輯迴歸python實現（未正則化）[對應ex2-ex2data2.txt資料集]

吳恩達機器學習邏輯迴歸python實現[對應ex2-ex2data1.txt資料集]

【吳恩達】機器學習第10章學習收穫

吳恩達-斯坦福CS229機器學習課程資料與演算法的Python實現

吳恩達-機器學習(6)-評估學習演算法、偏差與方差、構架垃圾郵件分類器、處理傾斜資料

吳恩達機器學習筆記 —— 10 神經網路引數的反向傳播演算法

資源 | Hinton、LeCun、吳恩達......不容錯過的15大機器學習課程都在這兒了

[吳恩達機器學習筆記]14降維1-2降維的應用資料壓縮與資料視覺化

吳恩達機器學習筆記10-梯度下降法實踐1-特征縮放

吳恩達-機器學習(10)-大資料集機器學習

文章目錄

Large Scale machine learning

Learning with large datasets

Stochastic Gradient Descent

Mini-Batch Gradient Descent

Stochastic Gradient Descent Convergence

Advanced Topics

Online Learning

Map-reduce and data parallelism

相關推薦