1. 程式人生 > >機器學習面試題之——簡單解釋正則化為什麼能減小模型複雜度

機器學習面試題之——簡單解釋正則化為什麼能減小模型複雜度

理論上,從VC維的角度可以解釋,正則化能直接減少模型複雜度。(公式理論略)

直觀上,對L1正則化來說,求導後,多了一項η * λ * sgn(w)/n,在w更新的過程中:

當w為正時,新的w減小,當w為負時,新的w增大,意味著新的w不斷向0靠近,即減小了模型複雜度。(PS:也是為什麼L1能得到稀疏解的一個參考答案)

對L2正則化來說,一方面,w的更新過程為:

若沒有L2,則w前面的係數為1,η、λ、n都是正的,所以 1−ηλ/n小於1,它的效果是減小w,這也就是權重衰減(weight decay)的由來。當然考慮到後面的導數項,w最終的值可能增大也可能減小。

模型的過擬合是因為考慮了過多的“不合適”樣本點,這樣,求導的時候,導數值很大,而自變數的值可大可小,所以意味著係數w要很大,所以當我們讓w減少的時候,即意味著忽略這些樣本點,即減小了模型的複雜度

,解決了過擬合。

相關推薦

機器學習試題——簡單解釋化為什麼減小模型複雜

理論上,從VC維的角度可以解釋,正則化能直接減少模型複雜度。(公式理論略) 直觀上,對L1正則化來說,求導後,多了一項η * λ * sgn(w)/n,在w更新的過程中: 當w為正時,新的w減小,當w為負時,新的w增大,意味著新的w不斷向0靠近,即減小了模型複雜度。(

機器學習試題——LR問題集合

一、LR為什麼是線性模型 Logistic Regression從機率的概念構建線性迴歸模型。一個事件發生的機率(odds)為該事件發生的概率與不發生概率的比值,機率的取值範圍為[0,+∞),其對數的取值範圍為實數域,所以,可以將對數機率作為因變數構建線性迴歸模型:    

[轉] [機器學習] 常用數據標準化()的方法

機器學習 數據 評價 分享 函數 http mean 常用方法 訓練 數據正則化 目的:為了加快訓練網絡的收斂性,可以不進行歸一化處理 源地址:http://blog.sina.com.cn/s/blog_8808cae20102vg53.html 而在多指標評價體系中,

吳恩達機器學習(第八章)---

在我們擬合的時候,根據我們選擇函式的不同可能會出現欠擬合,擬合程度較好,過擬合。 1.欠擬合和過擬合        欠擬合,上面第一張圖就是欠擬合情況,欠擬合表現為所選的函式沒有很好的擬合所給的資料,從影象上看就是很多資料都不在函式上,偏

機器學習】神經網路DNN的

和普通的機器學習演算法一樣,DNN也會遇到過擬合的問題,需要考慮泛化,之前在【Keras】MLP多層感知機中提到了過擬合、欠擬合等處理方法的問題,正則化是常用的手段之一,這裡我們就對DNN的正則化方法做一個總結。 1. DNN的L1&L2正則化 想到正則化,我們首先想到的就是L1正則化和L2正則化

機器學習損失函式、L1-L2的前世今生

前言: 我們學習一個演算法總是要有個指標或者多個指標來衡量一下算的好不好,不同的機器學習問題就有了不同的努力目標,今天我們就來聊一聊迴歸意義下的損失函式、正則化的前世今生,從哪裡來,到哪裡去。 一.L1、L2下的Lasso Regression和Ridg

資源 | 25個機器學習試題,期待你來解答

能力 類別 改善 正則化 時間序列 多個 數學 版本 batch 資源 | 25個機器學習面試題,期待你來解答 https://mp.weixin.qq.com/s/aL-gZ9LzYCkpTcsQF1FZjA 選自Medium 機器之心編譯 參與:Geek A

java試題簡單介紹一下集合框架

klist linklist lin key 很多 array 們的 簡單 數據存儲 集合框架分為三塊:List列表、Set集合、Map映射 List列表在數據結構上可以被看做線性表,常用的有ArrayList和LinkList(不常用的有Vector(類似於Arra

機器學習試題總結(轉)

原文連結: https://blog.csdn.net/sinat_35512245/article/details/78796328 1.請簡要介紹下SVM。 SVM,全稱是support vector machine,中文名叫支援向量機。SVM是一個面向資料的分類演算法,它的目標是為確定一個

常見的機器學習試題

1.請詳細說說支援向量機(support vector machine,SVM)的原理。 一般不會問,但是你要用自己的話說出來。 2.哪些機器學習演算法不需要做歸一化處理? 解析: 在實際應用中,通過梯度下降法求解的模型一般都是需要歸一化的,比如線性迴歸、logist

機器學習試題1-20

1.哪些機器學習演算法不需要做歸一化? 在實際應用中,通過梯度下降法求解的模型一般都是需要歸一化的,比如線性迴歸、logistic迴歸、KNN、SVM、神經網路等模型。 但樹形模型不需要歸一化,因為它們不關心變數的值,而是關心變數的分佈和變數之間的條件概率,如決策樹、隨機森

機器學習試題

relu優缺點 優點:relu不需要想sigmoid函式一樣進行復雜的指數運算,是的其收斂速度非常快。並且,relu函式的導數為1,不會導致梯度變小,因此一定程度上解決了梯度消失的問題。 缺點:在訓練過程中relu神經元比較脆弱,容易出現神經元“死亡”。如果神經元接收到一個非常大的梯度流之後,這個神經元的

41個機器學習試題

41 Essential Machine Learning Interview Questions (with answers) 一、演算法理論 Q1: 什麼是偏倚(bias)、方差(variable)均衡? 偏倚指的是模型預測值與真實值的差異,是由使用的

常見機器學習試題

參考:http://kubicode.me/2015/08/16/Machine%20Learning/Common-Interview/?from=singlemessage# http://blog.csdn.NET/heyongluoyao8/article/de

15道機器學習試題,讓你順利得到offer!

DT時代,機器學習作為一門熱門的科學研究專案,也成為了眾多IT人想要進修或從事的領域。現在,大聖眾包威客平臺(www.dashengzb.cn)便為大家蒐羅15道或常見或棘手的機器學習面試題目,讓欲從事相關工作的IT人能夠更加從容地走上機器學習專家之路。   問1

BAT機器學習試題1000題(311~315題)

《BAT機器學習面試1000題》系列作為國內首個AI題庫,囊括絕大部分機器學習和深度學習的筆試面

BAT機器學習試題1000題(316~320題)

《BAT機器學習面試1000題》系列作為國內首個AI題庫,囊括絕大部分機器學習和深度學習的筆試面

15道機器學習試題

1、你會在時間序列資料集上使用什麼交叉驗證技術?是用k倍或LOOCV?  都不是。對於時間序列問題,k倍可能會很麻煩,因為第4年或第5年的一些模式有可能跟第3年的不同,而對資料集的重複取樣會將分離這些趨勢,而我們最終可能只是需要對過去幾年的進行驗證,這就不能用這種方法了。相

BAT機器學習試題1000題(306~310題)

《BAT機器學習面試1000題》系列作為國內首個AI題庫,囊括絕大部分機器學習和深度學習的筆試面

機器學習試題整理

持更中。。。(最近電腦卡得要死) 主要focus在場景題上 一、2015百度校招筆試題 (1)垃圾郵件分類問題 1. 垃圾郵件分類特徵? 2. 訓練集中99%非垃圾、1%垃圾,訓練模型視為100%非垃圾,準確率?召回率? 3. 在實際的應用場景中,儘