機器學習筆記（參考吳恩達機器學習視訊筆記）06_正則化

阿新 • • 發佈：2018-11-12

6 正則化

6.1 過擬合問題

通過學習得到的假設可能能夠非常好地適應訓練集（代價函式可能幾乎為 0），但是可能會不能推廣到新的資料。如何處理過擬合問題：

1）丟棄一些不能幫助我們正確預測的特徵。可以是手工選擇保留哪些特徵，或者使用一些模型選擇的演算法來幫忙（例如 PCA）。

2）正則化。保留所有的特徵，但是減少引數的大小（ magnitude）。

6.2 正則化引數

迴歸問題中的模型為：，其中，高次項導致了過擬合的產生，若使高次項係數接近於0，就能更好地擬合。在一定程度上減小引數的值，就是正則化的基本方法。能夠防止過擬合問題的代價函式表示為：

其中，稱為正則化引數（Regularization Parameter），不對

進行懲罰。若

過大，會把所有的引數都最小化，導致模型變成

，造成欠擬合。取一個合理的

的值，這樣才能更好的應用正則化。

6.3 正則化線性迴歸

對於線性迴歸的求解，主要有兩種學習演算法：一種基於梯度下降，一種基於正規方程。正則化線性迴歸的代價函式為：

梯度下降演算法將分為兩種情形：

Repeat until convergence{

}

Repeat

對上面的演算法中j=1，2，…，n時的更新式子進行調整可得：

可以看出，正則化線性迴歸的梯度下降演算法的變化在於，每次都在原有演算法更新規則的基礎上令值減少了一個額外的值。

利用正規方程求解正則化線性迴歸模型，方法如下：

圖中的矩陣尺寸為（n+1）*（n+1）。

6.4 正則化邏輯迴歸

正則化邏輯迴歸的代價函式表示為：

最小化代價函式，通過求導，得出梯度下降演算法為：

Repeat until convergence{

}

機器學習筆記（參考吳恩達機器學習視訊筆記）16_決策樹

16 決策樹決策樹是一種監督學習演算法，以樹狀圖為基礎，其輸出結果為一系列簡單實用的規則。它就是一系列的if-then語句，既可以用於分類問題，也可以用於迴歸問題。構建決策樹之通常包括三個步驟： 1）特徵選擇 &n

機器學習筆記（參考吳恩達機器學習視訊筆記）15_推薦系統

15 推薦系統一個電影提供商，有5部電影和4個使用者。要求使用者為電影打分：前三部為愛情片，後兩部為動作片。Alice、Bob更傾向於愛情片，Carol、Dave更傾向於動作片。沒有一個使用者給所有的電影打過分。希望構建一個演算法來預測他們每個人可能會給他們每個人可能會給他們沒

機器學習筆記（參考吳恩達機器學習視訊筆記）14_異常檢測

14 異常檢測異常檢測（Anomaly detection）是機器學習演算法的一個常見應用。這種演算法的一個有趣之處在於：它雖然主要用於非監督學習問題，但從某些角度看，它又類似於一些監督學習問題。異常檢測主要用來識別欺騙。例如線上採集而來的有關使用者的資料，一個特徵向量中可能會包含如

機器學習筆記（參考吳恩達機器學習視訊筆記）13_降維

13 降維 13.1 動機一：資料壓縮假設兩個未知的特徵：是用釐米表示長度；是用英寸表示同一物體的長度。這是一種高度冗餘的表示。希望將這個二維的資料降至一維，即資料壓縮。 13.2 動機二：資料視覺化化降維可以使資料視覺化。關於許多不同國家的資料，每一個特徵向量都有50

機器學習筆記（參考吳恩達機器學習視訊筆記）12_聚類

12 聚類監督學習中，訓練集帶有標籤，目標是找到能夠區分正負樣本的決策邊界，需要根據標籤擬合一個假設函式。非監督學習中，需要將無標籤的訓練資料輸入到一個演算法，此演算法可以找到這些資料的內在結構。一個能夠根據資料的內在結構，將它們分成幾個不同的點集（或簇）的演算法，就被稱為聚類演算法。聚類

機器學習筆記（參考吳恩達機器學習視訊筆記）11_支援向量機

11 支援向量機 11.1 支援向量機的優化目標從邏輯迴歸開始展示我們如何一點一點修改來得到本質上的支援向量機。如圖，一個y=1的樣本，希望趨近於1，意味著當趨近於1時，應當遠大於0。一個y=0的樣本，希望趨近於0，意味著當趨近於0時，應當遠小於0。

機器學習筆記（參考吳恩達機器學習視訊筆記）10_機器學習系統的設計

10 機器學習系統的設計 10.1 構建學習演算法的方法以一個垃圾郵件分類器演算法為例。先要做的決定是如何選擇並表達特徵向量x, 可以選擇一個由 100 個最常出現在垃圾郵件中的詞所構成的列表，根據這些詞是否有在郵件中出現，來獲得我們的特徵向量（出現為 1，不出現為 0），尺寸為 10

機器學習筆記（參考吳恩達機器學習視訊筆記）09_應用機器學習的建議

9 應用機器學習的建議機器學習診斷法：是一種測試方法，通過執行這種測試，可以深入瞭解某種演算法到底是否有用。 9.1 評估假設函式通過評估假設函式來，來避免過擬合和欠擬合問題。模型通過訓練集得出引數後，對測試集運用該模型，有兩種方式計算誤差：對於線性迴歸模型，利用測

機器學習筆記（參考吳恩達機器學習視訊筆記）08_神經網路的學習

8 神經網路的學習 8.1 神經網路的代價函式神經網路的訓練樣本有m個，每個包含一組輸入x和一組輸出訊號y，L表示神經網路層數，表示每層的neuron個數（表示輸出層神經元個數），代表最後一層中處理單元的個數。將神經網路的分類定義為兩種情況：二類分類和多類分類。二類分類：=

機器學習筆記（參考吳恩達機器學習視訊筆記）07_神經網路介紹

7 神經網路介紹當特徵太多時，無論是線性迴歸還是邏輯迴歸模型計算的負荷會非常大。這時需要神經網路。神經網路是一種很古老的演算法，它最初產生的目的是製造能模擬大腦的機器。神經網路是計算量有些偏大的演算法。然而大概由於近些年計算機的執行速度變快，才足以真正執行起大規模的神經網路。類似於神

機器學習筆記（參考吳恩達機器學習視訊筆記）06_正則化

6 正則化 6.1 過擬合問題通過學習得到的假設可能能夠非常好地適應訓練集（代價函式可能幾乎為 0），但是可能會不能推廣到新的資料。如何處理過擬合問題： 1）丟棄一些不能幫助我們正確預測的特徵。可以是手工選擇保留哪些特徵，或者使用一些模型選擇的演算法來幫忙（例如 PCA）。 2

機器學習筆記（參考吳恩達機器學習視訊筆記）04_多變數線性迴歸

4 多變數線性迴歸 4.1 多維特徵代表特徵矩陣中第i行的第j個特徵，也就是第i個訓練例項的第j個特徵。支援多變數的假設函式h表示為：，其中，引入。此時模型中的引數是一個n+1維的向量，特徵矩陣X的維度是m*(n+1)。因此公式可以簡化為：。 4.2 多變數梯度下降在多

機器學習筆記（參考吳恩達機器學習視訊筆記）17_貝葉斯分類器

17 貝葉斯分類器貝葉斯分類是一種分類演算法的總稱，這種演算法均以貝葉斯定理為基礎，故統稱為貝葉斯分類。貝葉斯分類器的分類原理是通過某物件的先驗概率，利用貝葉斯公式計算出其後驗概率，即該物件屬於某一類的概率，選擇具有最大後驗概率的類作為該物件所屬的類。 17.1 貝葉斯

吳恩達機器學習 - 無監督學習——K-means演算法吳恩達機器學習 - 無監督學習——K-means演算法

原吳恩達機器學習 - 無監督學習——K-means演算法 2018年06月25日 12:02:37 離殤灬孤狼閱讀數：181

Coursera 深度學習吳恩達 deep learning.ai 筆記整理（3-2）——機器學習策略

新的 bsp 誤差 spa 歸納空間 font 處理整理一、誤差分析定義：有時我們希望算法能夠勝任人類能做的任務，但是當算法還沒達到人類所預期的性能時，人工檢查算法錯誤會讓你知道接下來做什麽，這也就是誤差分析檢查，發現會把夠狗當恒，是否需要做一個項目專門處理狗

吳恩達機器學習筆記（六） —— 支持向量機SVM

次數括號圖片最小我們支持向量機svm UNC 意思 strong 主要內容：一.損失函數二.決策邊界三.Kernel 四.使用SVM 一.損失函數二.決策邊界對於：當C非常大時，括號括起來的部分就接近於0，所以就變成了：

吳恩達機器學習筆記 —— 19 應用舉例：照片OCR（光學字符識別）

參考 https ocr 噪聲也說字符 www. 定位 cnblogs http://www.cnblogs.com/xing901022/p/9374258.html 本章講述的是一個復雜的機器學習系統，通過它可以看到機器學習的系統是如何組裝起來的；另外也說明了一

吳恩達機器學習課程筆記02——處理房價預測問題（梯度下降演算法詳解）

建議記住的實用符號符號含義 m 樣本數目 x 輸入變數 y 輸出變數/目標變數

吳恩達機器學習筆記（一），含作業及附加題答案連結

吳恩達機器學習筆記（一）標籤（空格分隔）：機器學習吳恩達機器學習筆記一一機器學習簡介機器學習的定義監督學習非監督學習

吳恩達機器學習學習筆記（四）（附作業程式碼註釋）

吳恩達機器學習學習筆記（四）標籤：機器學習吳恩達機器學習學習筆記四代價函式與反向傳播Costfunction and Backpropagation 一代價函式 1邏輯分類的評價函式

機器學習筆記（參考吳恩達機器學習視訊筆記）06_正則化

相關推薦