吳恩達機器學習筆記（十）-應用機器學習的建議

阿新 • • 發佈：2019-01-06

第十一章應用機器學習的建議

決定下一步做什麼

當要設計機器學習系統時，如何選擇一條最適合最高效的道路？

假設你已經實現了正則化的線性迴歸來預測房屋價格，然而，當在一組新的測試集上使用該假設時，在預測上出現了不能接受的錯誤，接下來會做什麼呢？也就是說當除錯學習演算法時，當面對測試集演算法效果不佳時，會怎麼做呢？

（1）採集更多的訓練樣本；（有時候並沒有效果）

（2）嘗試選用更少的特徵；

（3）嘗試獲取更多的特徵；

（4）嘗試增加特徵多項式；

（5）嘗試減小或增大正則化引數的值。

由此引出機器學習診斷法：這是一種測試法，通過執行這種測試能夠了解演算法在哪裡出了問題，也能告訴你要想改進一種演算法的效果，什麼樣的嘗試才是有意義的，這些診斷法的執行與實現需要花很多時間來理解和實現。

評估假設

在這一節中將介紹怎麼評價演算法學習得到的假設。

為了確保可以評價假設函式，需要將訓練集分成兩部分，第一部分成為訓練集，第二部分成為測試集。

典型按照7:3比例，如下：

1）訓練和測試線性迴歸的步驟：

1. 對訓練集進行學習得到引數θ（具體來說就是最小化訓練誤差）。

2. 計算出測試誤差：

這是線性迴歸時測試誤差的定義。

2）訓練和測試線性迴歸的步驟：

1. 從訓練資料中學習得到引數θ。

2. 計算出測試誤差：

3. 錯誤分類（0/1分類錯誤）

模型選擇、訓練、驗證、測試集

對於過擬合問題，在過擬閤中的學習演算法即便對訓練集擬合的很好，也並不代表它是一個很好的假設。通常來說，這就是為什麼訓練集誤差不能用來判斷該假設對新樣本的擬合好壞；具體來講，如果用這些引數來擬合訓練集，就算假設在訓練集上表現地很好，也並不意味著該假設對訓練集中沒有的新樣本有多好的泛化能力。更為普遍的規律，如果引數對某個資料集擬合的很好（比如訓練集或者其他資料集），那麼用同一資料集計算得到的誤差（比如訓練誤差）並不能很好地估計出實際的泛化誤差，即該假設對新樣本的泛化能力。

（1）模型選擇問題

在多項式迴歸時，該如何選擇次數作為假設模型呢？

如何從這些模型中選出最好的一個，應該看哪個模型有最小的測試誤差。

假設對這個例子，選擇五次多項式模型，看一看這個模型的泛化能力怎麼樣，可以觀察這個五項式對測試集的擬合情況，但問題是這樣仍然不能公平地評估出這個假設的泛化能力。原因：擬合了一個額外的引數d，也就是多項式的次數，用測試集擬合了引數d，選擇了一個能最好地擬合測試集的引數d的值，因此，引數向量θ5在測試集上的效能很可能是對泛化誤差過於樂觀的估計。

所以為了解決模型選擇出現的問題，通常會採用下面的方法來評估假設：

給定一個數據集，把它分成三個部分：訓練集、交叉驗證集、測試集，它們的比例為3:1:1，用交叉驗證集來作為評判選擇的標準，選擇合適的模型，而測試集則是作為演算法效能的評判

。