機器學習筆記第9課

阿新 • • 發佈：2018-11-03

開始關於學習理論的內容了，這比了解演算法，推導公式更為重要

（1）高偏差（bias）和高方差（variance）的權衡---欠擬合與過擬合的權衡

（2）ERM（經驗風險最小化 empirical risk minimizition）使訓練誤差最小（trainning error即為risk）

（3）訓練誤差（training error）:模型對於訓練的樣本分錯的概率

一般誤差（generaliztion error）:利用該假設進行實際的樣本分類（為出現過的樣本），分錯的概率

訓練誤差與一般誤差一般具有某些相似性，即訓練誤差較小往往一般誤差也比較小

（4）一致收斂表明了，對於一個假設集合中的所有假設，在大於等於某一概率（由霍夫丁不等式推出）的情況下，所有假設的訓練誤差與一般誤差之間的差值不大於某個定值（gamma可事前選定）。

當訓練樣本數量m增大時，假設集合中的所有假設的訓練誤差都會收斂到其一般誤差。

這裡的一致收斂有個前提是假設集合中的假設個數是有限的。

注意一致收斂的兩個推論，即樣本複雜度與誤差界。

（5）計算機。。對於任意K，logk<=30 ...... 僅僅是為了表明log函式增長的很慢

（6）對於一個假設而言，其訓練誤差一定小於等於一般誤差嗎？（不一定吧）

注意至今為止所做的假設，假設類的個數都是有限的

（7）當使用一個更為複雜的假設集合時，例如從線性假設集合到二次函式假設集合，偏差\方差權衡公式第一項變小而第二項變大，即偏差會變小而方差會變大（非正式的認為）。

（8）注意這裡所說的偏差與方差，並無直接上的數學的定義

我的理解是，偏差即為演算法對於資料的擬合程度，而方差刻畫的是演算法擬合的值對於中心值的離散程度。

偏差越小，演算法擬合越好，但可能會導致方差越大，即模型學會一些資料奇怪的特徵，泛化能力就會較差。

方差越小，擬合的結果越集中，對於外面資料的抗干擾能力越強，但是可能會帶來偏差過大，擬合的程度差，即該模型並沒有學習到資料的主要特徵。

--------------------------------------------------------------------------

在這裡，簡單的對於第9課的內容進行梳理

核心即在於偏差與方差權衡，即如何選擇一個較為好的學習模型。

從訓練誤差與一般誤差出發，根據霍夫丁不等式，量化訓練誤差與一般誤差的差異，並指出隨著訓練樣本m的增加，這種差異越來越小。

之後通過聯合界引理推匯出對於一個有限假設集合中所有假設，都具備上述性質，即量化的差異。由此，便是一致性收斂。

由一致性收斂得到兩個推論，即樣本複雜度和誤差界（通過固定引數即可推導）。

由一致性收斂，結合訓練誤差與一般誤差，可推匯出偏差\方差權衡公式。直觀上看，EPM最小的假設的一般誤差與實際上的最小一般誤差存在一個2倍gamma的差異，且gamma隨m增加而減少，隨k增加而增加。

根據偏差\方差權衡公式，可直觀上得出結論，隨著模型的複雜程度提升，偏差減少，而方差增大。選擇的優模型，應折中考慮偏差與方差兩個因素。

機器學習筆記第9課

開始關於學習理論的內容了，這比了解演算法，推導公式更為重要（1）高偏差（bias）和高方差（variance）的權衡---欠擬合與過擬合的權衡（2）ERM（經驗風險最小化 empirical risk minimizition）使訓練誤差最小（trainning error即為risk）

機器學習筆記第13課

（1）關於EM演算法的另一種理解方式根據Jensen不等式可以得出不等式構造要優化的最大似然函式 l（sita）的下界，而每一次的重複E、M步驟，實際上是一個座標上升的過程。E步驟，使Qi（z）最大化，M步驟使引數最大化。這也從另一方面驗證了EM演算法是收斂的。其實一開始提到的K-

機器學習筆記第12課

開始非監督學習的篇章（1）K-means 演算法，一個很經典且簡約的非監督學習演算法。演算法過程不再敘述。 K-means演算法的兩個過程：（1）將點分配到相應的類；（2）以均值作為新的類的類中心。實際上反覆的迭代這兩個過程，就是一個座標上升的過程。初始聚類中心的個數對演算法的效果有

機器學習筆記第11課

接著第10課末尾，闡述選擇特徵的另一種選擇方式：貝葉斯規範化（1）貝葉斯規範化也是為了解釋特徵選取過多造成的過擬合問題以線性迴歸為例，從頻率學派的觀點出發，當我們利用最大似然法求解迴歸方程中的sita向量時，認為sita就是真

機器學習筆記第10課

繼續學習有關學習理論方面的知識。（1）依賴於浮點數為64位，可得到一個不是那麼嚴格的結論，假設線性分類器共有d個引數，即m應與d成線性關係。代入樣本複雜度表示式即可得。（2）VC維的V和C分別代表兩個人 VC維=3，代表存在一個假設可以使其分散大小為3的集合。並不是要求其對於所有大小為3的

Bobo老師機器學習筆記第六課-梯度下降法

思維導圖筆記數學基礎連結：為什麼梯度方向是函式值增大最快的方向為什麼沿著梯度方向函式值上升的最快?為什麼梯度反方向是函式值下降最快的方向？練習程式碼 # -*- coding: utf-8 -*- import numpy as np import matplot

Bobo老師機器學習筆記第五課-多元線性迴歸

思維導圖學習筆記自己參考BoBo老師課程講解實現： # -*- coding: utf-8 -*- import numpy as np from metrics import r2_score class LinearRegression(object): def __

Bobo老師機器學習筆記第五課-線性迴歸演算法的評估指標

評價線性迴歸的指標有四種，均方誤差（Mean Squared Error）、均方根誤差（Root Mean Squared Error）、平均絕對值誤差（Mean Absolute Error）以及R Squared方法。 sklearnz中使用的，也是大家推薦的方法是R Squared方法。

Bobo老師機器學習筆記第五課-簡單線性迴歸

課程地址：https://coding.imooc.com/class/169.html 最小二乘法的推導部落格點選此處程式碼實現（參考Bobo實現，如果要看BoBo老師原始碼，請點選此處）： # -*- encoding: utf-8 -*- """ 實現簡單的線性迴歸, 自己

bobo老師機器學習筆記-第四課：KNN演算法

自己參考Bobo老師寫得程式碼：主要分為四個檔案： knn.py中實現KNN演算法、model_selection.py封裝了樣本資料的一些工具方法，比如切分為訓練集和測試集； metrics用來對模型進行評估、client用來呼叫演算法進行執行 # -*- encoding:

機器學習筆記第3課：引數演算法和非引數演算法

什麼是引數機器學習演算法？它與非引數機器學習演算法有何不同？ “假設”通常會大大簡化學習過程，但也會限制學到的東西。將函式簡化為已知形式的演算法，稱為引數機器學習演算法。它包括兩個步驟：選擇函式的形式。從訓練資料中學習該函式的係數。常見的引數機器學習演算法是線

機器學習筆記第2課：適用於所有演算法的原則

機器學習中的監督學習演算法，常常用於預測建模。這些演算法有一個共通的原則。人們一般這樣來描述機器學習演算法：學習一個目標函式（f），能夠最好地將輸入變數（X）對映到輸出變數（Y）。 Y = f（X）這是一個常見的學習任務。我們期望在給定新的輸入變數（X）時，對（Y）做出預測。我們並不知

機器學習筆記第1課：機器學習中的資料

資料在機器學習中起著重要的作用。在談論資料時，理解和使用正確的術語非常重要。你如何看待資料？想想電子表格吧，有列、行和單元格。從統計視角而言，機器學習的任務是在假設函式( f )的上下文中構建資料。這些假設函式由機器學習演算法通過學習建立。給定一些輸入變數( Input )，該函式回答

機器學習筆記第5課：線性迴歸演算法

線性迴歸可能是統計學和機器學習中最知名且易於理解的演算法之一。它不就是一項起源於統計學的技術嗎？預測建模主要關注的是讓模型的誤差最小化，或者說，在可以解釋的前提下，儘可能作出最準確的預測。我們會借用，重用，甚至是竊取許多不同領域（包括統計學）的演算法，並將其用於上述的目標。線性迴歸

機器學習筆記第4課：偏差，方差和權衡

經由偏差 - 方差的權衡，我們可以更好地理解機器學習演算法。偏差（bias）是模型所做的簡化假設，其目的是更容易地學習目標函式。通常，引數演算法具有高偏差。它們學習起來很快，且易於理解，但通常不太靈活。反過來，它們對複雜問題的預測效能較低，無法滿足演算法偏差的簡化假設。決策樹是一種

Bobo老師機器學習筆記第八課-方差、偏差、嶺迴歸、LASSO迴歸？

對誤差分類問題一、什麼是偏差和方差？先看下面這幅圖圖：方差：都是圍著資料中心的，方差越大則表示距離資料中心分佈的越分散，越小說明越近越集中偏差：偏離資料中心，偏差越大，說明整個資料距離中心越遠，偏差越小，說明距離資料中心越近。這兩者的關係通常是矛盾的，降低偏

Bobo老師機器學習筆記第八課-什麼是交叉驗證？

1、測試資料的真正意義是什麼？在上篇部落格中，我們看到測試集和訓練集在同一個模型上會表現不同的結果。我們通過學習曲線可以直觀的看到具體是過擬合還是欠擬合，從而調整引數，進行不斷驗證，直到找到一個在訓練集表現好的資料。總結一句話，就是通過測試資料進行對模型的調優。 2、依

Bobo老師機器學習筆記第八課-如何防止過擬合和欠擬合？

問題一、什麼是過擬合和欠擬合？首先擬合是一個統計學概念，它表示所求函式逼近目標函式的遠近程度。應用的機器學習中，就是我們所求的函式與未知的對映函式之間的相似度。如何求得函式引數與潛在的函式引數越逼近，說明效果越好。假設我們用上篇部落格中的資料，原始碼可以見上文：通

Bobo老師機器學習筆記第八課-多項式迴歸

問題1: 什麼是多項式迴歸？以前我們學習了線性迴歸，但是線性迴歸比較適用於資料之間明顯線性關係的。但有時我們使用的資料不一定它們之間有線性關係。那麼這時候就要用到多項式迴歸。多項式我們以前學過，那麼多項式的迴歸方程就類似於問題2: 那麼非線性的資料，我們如何做呢，比如下面資料？

Bobo老師機器學習筆記第五課-邏輯迴歸理論

1、什麼是邏輯迴歸？（Logistic Regresssion）邏輯迴歸（Logistic Regression）是一種用於解決二分類（0 or 1）問題的機器學習方法，用於估計某種事物的可能性。邏輯迴歸既可以看做是一個迴歸演算法，也可以看作是一個分類問題，通常是用過分類，並且是二分類。分類

機器學習筆記 第9課

相關推薦

機器學習筆記第9課