1. 程式人生 > >數學模型的過擬合和欠擬合

數學模型的過擬合和欠擬合

1. 過擬合

1.1 產生原因

  • 訓練集中的資料抽取錯誤,太少,或者不均衡,不足以有效代表業務邏輯或場景;
  • 訓練集中的資料噪音(異常值)干擾過大;
  • 訓練模型的“邏輯假設“到了模型應用時已經不能成立
  • 引數太多,模型複雜度太高;
  • 特徵量太多,模型訓練過度,比如決策樹模型,神經網路模型

1.2 解決方法

  • 減少特徵數量
  • 正則化
  • 增大樣本訓練規模,取樣均衡
  • 簡化模型
  • 交叉驗證
  • 去除異常值
  • Dropout

2. 欠擬合

1.1 產生原因

  • 模型複雜度過低
  • 特徵量過少

1.2 解決方法

  • 增加新特徵
  • 增加模型複雜度
  • 減少正則化係數