系統學習機器學習之正則化（二）

阿新 • • 發佈：2019-01-23

監督機器學習問題無非就是“minimizeyour error while regularizing your parameters”，也就是在規則化引數的同時最小化誤差。最小化誤差是為了讓我們的模型擬合我們的訓練資料，而規則化引數是防止我們的模型過分擬合我們的訓練資料。多麼簡約的哲學啊！因為引數太多，會導致我們的模型複雜度上升，容易過擬合，也就是我們的訓練誤差會很小。但訓練誤差小並不是我們的最終目標，我們的目標是希望模型的測試誤差小，也就是能準確的預測新的樣本。所以，我們需要保證模型“簡單”的基礎上最小化訓練誤差，這樣得到的引數才具有好的泛化效能（也就是測試誤差也小），而模型“簡單”就是通過規則函式來實現的。另外，規則項的使用還可以約束我們的模型的特性。這樣就可以將人對這個模型的先驗知識融入到模型的學習當中，強行地讓學習到的模型具有人想要的特性，例如稀疏、低秩、平滑等等。要知道，有時候人的先驗是非常重要的。前人的經驗會讓你少走很多彎路，這就是為什麼我們平時學習最好找個大牛帶帶的原因。一句點撥可以為我們撥開眼前烏雲，還我們一片晴空萬里，醍醐灌頂。對機器學習也是一樣，如果被我們人稍微點撥一下，它肯定能更快的學習相應的任務。只是由於人和機器的交流目前還沒有那麼直接的方法，目前這個媒介只能由規則項來擔當了。

系統學習機器學習之正則化（二）

系統學習機器學習之正則化（二）

機器學習之正則化（Regularization）

機器學習筆記4：正則化（Regularization）

scala之正則表示式（二）內部匹配函式

機器學習中的正則化（Regularization）

機器學習筆記——正則化（regularization）

機器學習基礎（三十） —— 線性迴歸、正則化（regularized）線性迴歸、區域性加權線性迴歸（LWLR）

Java學習--設計模式之結構型模式（二）

Python爬蟲之正則表示式（1）

為什麼正則化（Regularization）可以減少過擬合風險

正則化（regularization）

正則表示式（二）——進階之匹配分組

神經網路模型無法正常工作時我們應該做什麼（系列）——正則化（Regularlization）

資料預處理中歸一化（Normalization）與損失函式中正則化（Regularization）解惑

Windows 活動目錄（AD）服務器系統升級到2012之域控升級（二）

java8之行為引數化（二）

正則表示式（二）常用元字元

正則表示式（二）驗證郵箱、電話號碼

正則表示式（二）-- 匹配一組字元

機器學習演算法之正則化

系統學習機器學習之正則化（二）

相關推薦