1. 程式人生 > >機器學習筆記——正則化(regularization)

機器學習筆記——正則化(regularization)

正則化

過擬合

我們在利用資料來進行曲線擬合的時候會出現三種情況,欠擬合(underfitting),合適(just right),過擬合(overfitting)。欠擬合的情況一般是由於變數太少,而過擬合的原因一般是變數太多

下面我們主要考慮過擬合的問題。過擬合的解決方法一種是減少特徵的數量,一種就是正則化

代價函式

正則化採用的方法就是修改代價函式,將其加上我們認為不那麼重要的項,例如下面這個例子我們加上θ3和θ4,我們可以知道這樣在優化的時候θ3和θ4會很小,這樣這兩項對函式的影響就很小,相當於這兩項消失了,也就相當於減少了特徵的數量,解決了過擬合的問題。雖然我們沒有進行嚴謹的數學證明,但是我們可以憑直覺感覺到這件事是對的

但是如果我們將θ前面係數都設定的過大的話就有可能導致欠擬合的問題

線性迴歸

下面我們將正則化應用到線性迴歸上。我們可以知道對於梯度下降法,演算法過程應該做如下調整

對於正規方程法我們要做如下調整。另外要提的一點是,我們之前講過正規方程需要注意矩陣不可逆的情況,但當我們對其進行正則化以後我們可以證明這個新的矩陣總是可逆的,這也是正則化的另一個優點

logistic迴歸

我們將正則化應用到logistic迴歸的梯度下降法上有如下結果

應用到高階優化上有如下結果