機器學習/深度學習入門：過擬合問題

阿新 • • 發佈：2019-02-11

關於神經網路中過擬合的問題小記。

在訓練的時候你的模型是否會出現訓練時速度很慢？或者預測結果與訓練結果相差過大的現象？那我們可能就需要處理一下過擬合的問題了。

當你的模型過於複雜時，比如說輸入引數過多，你的模型就會出現過擬合問題，該模型雖然會在訓練集上表現出較好的預測結果，然而！在預測的時候呢？預測結果就會表現的很差。根據維基的定義以及我平時的一些實驗總結，當你observation 的noise 過多，輸入維度過大，都可能會導致overfitting。

解決辦法就是我們可以啟用交叉驗證（cross-validation），正則化（regularization），Early Stopping，剪枝（pruning），Bayesian priors，新增Dropout層，

這幾種方法。

cross-validation：

cross-validation 的原理就是現在它的一個子集上做訓練，這個子集就是訓練集，再用驗證集測試所訓練出的模型，來評價模型的效能和指標，最後再用測試集來預測。

Early Stopping就是在每次訓練的epoch結束時，將計算出的accuracy 跟上一次的進行比較，如果accuracy 不再變化，那麼停止訓練。

regularization：

模型假設三層，輸入，隱藏，輸出。輸入層為2個神經元，輸出為2個，batchsize為10，下圖為當隱藏層神經元個數分別設定為3,6,20時，模型的情況：
這裡寫圖片描述
注意看當隱藏神經元為20時，模型的狀況，每個紅色的點都被完美的歸類，沒錯，這在訓練時結果是很好，但是在測試集的表現呢？這就不一定了，誰能保證自己的訓練結每點噪聲呢？是不是？所以用這個模型去預測未知的，就可能造成預測結果很差，這就是NN的overfitting問題。

所以一般大部分情況，我們在除錯模型時很多時候是在跟overfitting做鬥爭。關於regularization 方法。

簡單來說就是在目標函式上加一個λλ 使之變成 Error+λf(θ)Error+λf(θ) ，λλ 用來懲罰那些權重很大的向量,稱之為正則係數吧！λ=0λ=0 就意味著沒有采用regularization來預防overfitting。

regularization 有 L1 regularization和L2 regularization。如果你想知道哪一個特徵對最後的結果產生了比較大的影響，可以採用L1 regularization，如果你不那麼在意對特徵的分析，那就用L2 regularization吧。

新增Dropout層：

具體實現可參考論文：Dropout: A Simple Way to Prevent Neural Networks from Overfitting

機器學習/深度學習入門：過擬合問題

cross-validation：

regularization：

新增Dropout層：

機器學習/深度學習入門：過擬合問題

機器學習中：過擬合（overfitting）和欠擬合（underfitting）

20171028機器學習之線性回歸過擬合問題的解決方案

機器學習筆記（五）過擬合問題及正則化

TensorFlow學習---tf.nn.dropout防止過擬合

【轉載】TensorFlow學習---tf.nn.dropout防止過擬合

【機器學習入門】Andrew NG《Machine Learning》課程筆記之四：分類、邏輯迴歸和過擬合

斯坦福大學公開課機器學習： advice for applying machine learning - evaluatin a phpothesis（怎麽評估學習算法得到的假設以及如何防止過擬合或欠擬合）

機器學習之路： python線性回歸過擬合 L1與L2正則化

機器學習：欠擬合和過擬合

機器學習：什麼是過擬合和欠擬合

機器學習：決策樹過擬合與剪枝，決策樹程式碼實現（三）

機器學習概念篇：監督學習、過擬合，正則化，泛化能力等概念以及防止過擬合方法總結

機器學習、深度學習模型過擬合的處理方法

機器學習筆記05：正則化(Regularization)、過擬合(Overfitting)

機器學習：偏差、方差與欠擬合、過擬合

機器學習-11：MachineLN之過擬合

機器學習的防止過擬合方法

機器學習中防止過擬合方法

ng機器學習視頻筆記（五） ——過擬合與正則化

機器學習/深度學習入門：過擬合問題

cross-validation：

regularization：

新增Dropout層：

相關推薦