L1、L2正則(Regularization )簡介

阿新 • • 發佈：2019-01-27

過擬合就是隨著模型的複雜度的增加，訓練集上的正確率很高error很小，訓練集擬合的非常好，但是在測試集上面的錯誤率卻越來越高，效果很差，即模型的泛化能力很差；

而正則化是通過約束引數的範數使其不要太大，所以可以在一定程度上減少過擬合情況；防止過擬合的方法有很多，比如：early stopping，L2正則等；

L1可以實現稀疏，關於稀疏可以暫且理解為：讓引數W是稀疏的，就是希望W的大部分元素都是0。影響預測結果y的特徵有很多，但是其中一部分特徵對輸出y是完全沒有影響的，在最小化目標函式的時候雖然加入這些特徵會降低訓練誤差，但是實際應用這些無效的特徵資訊會干擾y的正確預測，所以我們引入稀疏將這些特徵的權重置為0，從而起到選擇有效特徵的作用；

L2正則（範數）是指向量各元素的平方和然後求平方根。我們讓L2範數的規則項||W||₂最小，可以使得W的每個值都很小，都接近於0，注意與L1範數不同，它不會讓它等於0，而是接近於0，這裡有很大的區別。

而越小的引數說明模型越簡單，越簡單的模型則越不容易產生過擬合現象，如圖所示：當w的值比較大時，說明斜率比較大，資料會出現明顯的波動上升或下降，只有當w都比較小時曲線的斜率才會比較小，導數絕對值比較小，曲線不會過分擬合數據。

L1、L2正則(Regularization )簡介

L1、L2正則(Regularization )簡介

L1、L2 正則項詳解 - 解空間、先驗分佈、最大似然估計 and 最大後驗估計

L1、L2正則化

深入理解L1、L2正則化原理與作用

泛化能力、訓練集、測試集、K折交叉驗證、假設空間、欠擬合與過擬合、正則化（L1正則化、L2正則化）、超引數

機器學習之路： python線性回歸過擬合 L1與L2正則化

L1和L2正則化直觀理解

L1，L2正則化

L1和L2正則化。L1為什麼能產生稀疏值，L2更平滑

L1與L2正則化

【通俗易懂】機器學習中 L1 和 L2 正則化的直觀解釋

神經網路中的過擬合的原因及解決方法、泛化能力、L2正則化

dropout和L1，L2正則化的理解筆記

機器學習筆記（二）L1，L2正則化

java手寫邏輯迴歸包括L1，L2正則實現

深入剖析迴歸（二）L1，L2正則項，梯度下降

L1和L2正則化區別

批歸一化（Batch Normalization）、L1正則化和L2正則化

深度學習 --- 優化入門六（正則化、引數範數懲罰L0、L1、L2、Dropout）

訓練過程--正則化(regularization)技巧(包括L2正則化、dropout，資料增廣，早停)

L1、L2正則(Regularization )簡介

相關推薦