1. 程式人生 > >吳恩達機器學習訓練祕籍整理二十八到三十二章(四)學習曲線

吳恩達機器學習訓練祕籍整理二十八到三十二章(四)學習曲線

第二十八章:

繪製學習曲線。隨著訓練集的增加,錯誤率逐漸的減少。

 第二十九章:

繪製訓練誤差曲線。隨著訓練集大小的增加,開發集(和測試集)誤差應該會降低,但你的訓練集誤差往往會同時增加。

 第三十章:

高偏差:

  • 隨著我們新增更多的訓練資料,訓練誤差只會變得更糟。因此藍色的訓練誤差曲線只會保持不動或上升,這表明它只會遠離期望的效能水平(綠色的線)。

  • 紅色的開發誤差曲線通常要高於藍色的訓練誤差曲線。因此只要訓練誤差高於期望效能水平,通過新增更多資料來讓紅色開發誤差曲線下降到期望效能水平之下也基本沒有可能。

 第三十一章:

藍色訓練誤差曲線相對較低,紅色的開發誤差曲線比藍色訓練誤差高得多。因此,偏差很小,但方差很大。新增更多的訓練資料可能有助於縮小開發誤差和訓練誤差之間的差距。

下圖 這種情況下訓練誤差很大,因為它比期望的效能水平要高得多。開發誤差也比訓練誤差大得多,因此有著明顯的偏差和方差。此時你必須找到一種方法來減少演算法中的偏差和方差。

第三十二章:

 繪製學習曲線