1. 程式人生 > >L1和L2正則化。L1為什麼能產生稀疏值,L2更平滑

L1和L2正則化。L1為什麼能產生稀疏值,L2更平滑

參考部落格:https://zhuanlan.zhihu.com/p/35356992

     https://zhuanlan.zhihu.com/p/25707761

     https://www.zhihu.com/question/37096933/answer/70426653

  首先正則化項一般是模型複雜度的單調遞增函式,模型越複雜,正則化的值會越大。

  正則化是結構風險最小化的一種策略實現,在經驗風險最小化的基礎上(也就是訓練誤差最小化),儘可能採用簡單的模型,以此提高泛化預測精度。

  經驗風險較小的模型可能較複雜,這時會使正則化項變大。正則化的作用就是選擇經驗風險和模型複雜度同時較小的模型。

  同時也符合奧卡姆剃刀原理:在所有可能選擇的模型中,能夠很好解釋資料並且十分簡單才是好的模型。通過降低模型的複雜度,得到更小的泛化誤差,降低過擬合程度。

  、