【機器學習（李巨集毅）】三、Bias and Variance

阿新 • • 發佈：2018-12-31

本講核心問題：Where does the error come from？

Review：

更復雜的模型不一定在測試集上有更好的表現
誤差由偏差“bias”導致
誤差由方差“variance”導致

這裡寫圖片描述

Estimator：

f^是計算pokemon真正的函式，只有Niantic公司知道
從訓練集上，我們得出f∗，f∗是f^的一個估計
故像射擊一樣，靶心為f^，f∗是我們射中的地方，會由於“bias”和“variance”導致射偏。

這裡寫圖片描述

Bias and Variance of Estimator：

估測均值μ：用m來估計均值μ是unbiased的（注意理解下其中公式）

這裡寫圖片描述

估計方差σ2:用s2來估計σ2是biased的（同樣注意理解其中公式）

6？？

形象解釋Bias和Variance

就像射擊一樣，你瞄準點同靶心的距離就是Bias；你實際射在靶心上的位置與你瞄準點的距離就是Variance。

這裡寫圖片描述

Parallel Universes

蒐集多個訓練集

這裡寫圖片描述

在所有訓練集上，用相同的模型，得到不同的f∗

這裡寫圖片描述

三種模型，每種模型在一百個資料集上得到的f∗的情況

Variance

較簡單的模型在受不同樣本的影響較小，有更小的方差。(聚集在靶上瞄準的位置)
較複雜模型有較大的方差。（分佈在靶心周圍，分散的很開）

這裡寫圖片描述

Bias

用f∗的期望去衡量Bias，用f¯與f^的近似程度來衡量偏差
大的偏差（見圖）：瞄的就不準，偏靶心一段距離。
小的偏差（見圖）：瞄的準，圍繞靶心。

這裡寫圖片描述

黑色曲線：假定的f^；
紅色曲線：5000個不同資料集下的f∗；
藍色曲線：5000個f∗的平均f¯
三種不同模型，1次、3次、5次。

這裡寫圖片描述
可以看出：

簡單模型，大的偏差。（上圖：f¯與f^近似度小；下圖：偏離靶心。）
複雜模型，小的偏差。（上圖：f¯與f^很近似；下圖：圍繞靶心。）

這裡寫圖片描述

Bias vs Variance

隨著模型變複雜，Bias導致的error下降；
隨著模型變複雜，Variance導致的error上升；

隨著模型變複雜，error由下降到上升。
模型較簡單時，大的Bias，小的Variance，Underfitting!
模型過於複雜時，小的Bias，大的Variance，Overfitting！

這裡寫圖片描述

What to do with large bias?

診斷：

如果模型甚至不能夠擬合訓練集，那有大的Bias，Underfitting!
如果模型能夠擬合訓練集，但是在測試集上有很大的error，那可能有大的Variance，Overfitting！

對於Bias，重新設計模型：

增加更多的特徵作為輸入；
一個更復雜的模型。

這裡寫圖片描述

What to do with large variance?

更多的data（效果見圖）：非常有效，但不是都很實際，因為有可能沒有條件蒐集更多的data；
正則化（效果見圖）

這裡寫圖片描述

Model Selection

通常在Bias和Variance之間有一個權衡；
平衡兩種誤差，選擇一個模型，使得總誤差最小；
不該做得事：用三種模型在訓練集上訓練，得出三種f∗，分別在自己的測試集上得出error，選擇此時error最小的f∗，然後就把它放在真正的測試集上測試。（下圖繼續解釋為何這樣不好，以及該怎樣做）

這裡寫圖片描述

以Homework為例，如果用上面的做法，會導致你在真正的測試集上表現很差。（下面會繼續介紹正確做法）

這裡寫圖片描述

Cross Validation

將訓練集分成兩部分，一部分為訓練集，另一部分為驗證集；
用訓練集分別訓練三種模型，在驗證集上得出error，選取error最小的模型；
用整個原始的訓練集，去訓練得出來的模型，在測試集上得出error；
在真正的測試集上得出error，這樣的話效果好，才是真的好。

不建議做的事：

看到在測試集上（自己的）的效果不好，然後反過來去調整模型。這樣做雖然對於人之常情或者發paper來說是不可避免的，但要強調的是：這樣做了，也只是在你自己的測試集上的效果好，在真正的測試集上的效果不一定會變好。

這裡寫圖片描述

N-fold Cross Validation

將訓練集分成三部分，取其中一份為驗證集，有三種組合情況；
用三種模型在這三種情況下進行訓練，然後在驗證集上得出error，取三種情況下error的均值，均值error最小的情況作為選定的最好的模型；
將選出的模型，用原始的整個訓練集訓練，然後在測試集上得出error；
在真正的測試集上得出error。

這裡寫圖片描述

【機器學習（李巨集毅）】三、Bias and Variance

本講核心問題：Where does the error come from？ Review：更復雜的模型不一定在測試集上有更好的表現誤差由偏差“bias”導致誤差由方差“variance”導致 Estimator： f^是計算poke

【統計學習方法-李航-筆記總結】三、k近鄰法

本文是李航老師《統計學習方法》第三章的筆記，歡迎大佬巨佬們交流。主要參考部落格：https://blog.csdn.net/u013358387/article/details/53327110 主要包括以下幾部分： 1. k近鄰演算法 2. k近鄰模型 3. kd樹 1.

[機器學習入門] 李巨集毅機器學習筆記-1（Learning Map 課程導覽圖）

在此就不介紹機器學習的概念了。 Learning Map（學習導圖） PDF VIDEO 先來看一張李大大的總圖↓ 鑑於看起來不是很直觀，我“照虎

[機器學習入門] 李巨集毅機器學習筆記-5（Classification- Probabilistic Generative Model；分類：概率生成模型）

[機器學習] 李巨集毅機器學習筆記-5（Classification: Probabilistic Generative Model；分類：概率生成模型） Classification

[機器學習入門] 李巨集毅機器學習筆記-15 （Unsupervised Learning: Word Embedding；無監督學習：詞嵌入）

[機器學習入門] 李巨集毅機器學習筆記-15 （Unsupervised Learning: Word Embedding；無監督學習：詞嵌入） PDF VIDEO

[機器學習入門] 李巨集毅機器學習筆記-6 （Classification: Logistic Regression；邏輯迴歸）

[機器學習] 李巨集毅機器學習筆記-6 （Classification: Logistic Regression；Logistic迴歸） PDF VIDEO Three steps Step 1: Function Set

[機器學習入門] 李巨集毅機器學習筆記-14 （Unsupervised Learning: Linear Dimension Reduction；無監督學習：線性降維）

[機器學習入門] 李巨集毅機器學習筆記-14 （Unsupervised Learning: Linear Dimension Reduction；線性降維） PDF VI

機器學習（吳恩達）-筆記整理、問題提出-（1-19）

這個課講得很不錯的，把數學部分省略了不少，雖然這是一件危險的事（在危險的邊緣瘋狂試探。誤）。目前看到19，更新到19的筆記。筆記我採用的是英文的，方便和文件接軌。詞彙： Field: 1.n

Coursera-機器學習（吳恩達）第三週-程式設計作業

1、邏輯迴歸邏輯迴歸與線性迴歸的主要區別在於假設函式，邏輯迴歸中的假設函式： hθ(x) = g(θ'x)=sgmoid(θ’

【統計學習方法-李航-筆記總結】十、隱馬爾可夫模型

本文是李航老師《統計學習方法》第十章的筆記，歡迎大佬巨佬們交流。主要參考部落格: https://www.cnblogs.com/YongSun/p/4767667.html https://www.cnblogs.com/naonaoling/p/5701634.html htt

【統計學習方法-李航-筆記總結】九、EM(Expectation Maximization期望極大演算法)演算法及其推廣

本文是李航老師《統計學習方法》第九章的筆記，歡迎大佬巨佬們交流。主要參考部落格: https://www.cnblogs.com/YongSun/p/4767517.html https://blog.csdn.net/u010626937/article/details/751160

【統計學習方法-李航-筆記總結】八、提升方法

本文是李航老師《統計學習方法》第八章的筆記，歡迎大佬巨佬們交流。主要參考部落格： https://www.cnblogs.com/YongSun/p/4767513.html 主要內容包括： 1. 提升方法AdaBoost演算法 2. AdaBoost演算法的訓練誤差分析

【統計學習方法-李航-筆記總結】七、支援向量機

本文是李航老師《統計學習方法》第七章的筆記，歡迎大佬巨佬們交流。主要參考部落格： https://www.cnblogs.com/YongSun/p/4767130.html https://blog.csdn.net/wjlucc/article/details/69376003

【統計學習方法-李航-筆記總結】六、邏輯斯諦迴歸和最大熵模型

本文是李航老師《統計學習方法》第六章的筆記，歡迎大佬巨佬們交流。主要參考部落格： http://www.cnblogs.com/YongSun/p/4767100.html https://blog.csdn.net/tina_ttl/article/details/53519391

【統計學習方法-李航-筆記總結】五、決策樹

本文是李航老師《統計學習方法》第五章的筆記，歡迎大佬巨佬們交流。主要參考部落格： https://blog.csdn.net/u014248127/article/details/78971875 https://www.cnblogs.com/YongSun/p/4767085.ht

【統計學習方法-李航-筆記總結】四、樸素貝葉斯法

本文是李航老師《統計學習方法》第四章的筆記，歡迎大佬巨佬們交流。主要參考部落格： https://blog.csdn.net/zcg1942/article/details/81205770 https://blog.csdn.net/wds2006sdo/article/detail

【Python學習記錄——從入門到放棄】三、操作列表

本文使用的書籍是《Python程式設計：從入門到實踐》本文使用的是Python3.6 一、遍歷整個列表在Python中，你經常需要遍歷列表的所有元素，對每個元素執行相同的操作。我們可以用for迴圈來進行遍歷操作，現在用幾個例子來講述for迴圈的使用： mag

機器學習【吳恩達|周志華|李巨集毅|演算法】清單 #收藏#

網路轉自：https://blog.csdn.net/julialove102123/article/details/78729602系列學習記錄：1、吳恩達機器學習系列；2、李巨集毅機器學習課程；3、周志華西瓜書；4、十大演算法練習；5、系列學習資源；周志華：

【深度學習基礎】《深度學習》李巨集毅

重要知識點：激勵函式（activation function） softmax layer Lecture 1: Introduction of Deep Learning 1. 深度學習的步驟機器學習的步驟： Step 1: 定義一個函式集合(define

強化學習 by 李巨集毅（個人記錄向)

P2Proximal Policy Optimization (PPO) importance sampling： On-policy -> Off-policy Gradient for update: *KL divergence(

【機器學習（李巨集毅）】 三、Bias and Variance

本講核心問題：Where does the error come from？

Review：

Estimator：

Bias and Variance of Estimator：

形象解釋Bias和Variance

Parallel Universes

Variance

Bias

Bias vs Variance

What to do with large bias?

What to do with large variance?

Model Selection

Cross Validation

N-fold Cross Validation

相關推薦

【機器學習（李巨集毅）】三、Bias and Variance