Coursera吳恩達機器學習課程總結筆記及作業程式碼——第6周有關機器學習的小建議

阿新 • • 發佈：2019-01-07

1.1 Deciding what to try next

當你除錯你的學習演算法時，當面對測試集你的演算法效果不佳時，你會怎麼做呢？
這裡寫圖片描述

獲得更多的訓練樣本？
嘗試更少的特徵？
嘗試獲取附加的特徵？
嘗試增加多項式的特徵？
嘗試增加λ?
嘗試減小λ?

由此我們引出了機器學習診療法

1.2 EvaluaDng a hypothesis

這裡寫圖片描述
我們通過將資料集分成訓練集和測試集，
將訓練集訓練出的引數用測試集資料測試效能。

線性迴歸時：
Jtest(θ)=12mtest∑mtesti=1(hθ(x(i)test)−y(i)test)2

邏輯迴歸時：
Jtest(

θ)=−12mtest∑mtesti=1y(i)testlog(hθ(x(i)test))+(1−y(i)test)log(1−hθ(x(i)test))

1.3 Model selecDon and training/validaDon/test sets

在多項式迴歸時，我們該怎麼選擇次數作為我們的假設模型呢？
這裡寫圖片描述
我們可以把資料集分為三類，訓練集，交叉驗證集和測試集，
用交叉驗證集來作為評判選擇的標準，選擇合適的模型，而測試集則是作為演算法效能的評判。

1.4 Diagnosing bias vs variance

這裡寫圖片描述
上面的圖分別表示了高偏差，剛好，高方差

train(θ)=12mtrain∑mtraini=1(hθ(x(i)train)−y(i)train)2
Jcv(θ)=12mcv∑mcvi=1(hθ(x(i)cv)−y(i)cv)2
這裡寫圖片描述

從圖中可以看出，隨著多項式次數的增大，訓練集上的偏差逐漸變小，而交叉驗證集上的偏差在減小到一定程度後開始升高。

在高偏差（欠擬閤中）
Jtrain(θ)很高
Jcv(θ)≈Jtrain(θ)

在高方差（過擬閤中）
Jtrain(θ)很低
Jcv(θ)≫Jtrain(θ)

1.5 Regularization and bias/variance

在加入正則化項後根據λ的不同所得圖如下
這裡寫圖片描述

我們同樣可以通過在交叉驗證集上的測試選擇較好的λ值
這裡寫圖片描述

根據λ大小畫出的擬合曲線如下
這裡寫圖片描述

1.6 Learning curves

根據樣本的大小與誤差的關係我們可以畫出一般的學習曲線模樣
這裡寫圖片描述

在高偏差的情況下，隨著樣本數目的增大，訓練集上的誤差和交叉驗證集上的誤差逐漸逼近。
這裡寫圖片描述
也就是說，增大樣本的方法對高偏差的模型並不能起到一定作用

而模型處於高方差的情況下，增大樣本可能會起到效果。
這裡寫圖片描述

對開頭提出的各種措施，我們看看他們適合於什麼樣的模型
這裡寫圖片描述

2.1 Machine learning system design

以做一個垃圾郵件分類器為例。
我們需要尋找最頻繁出現出現的n個單詞（10000~50000）作為訓練集，而不是隨意手工

Coursera吳恩達機器學習課程總結筆記及作業程式碼——第6周有關機器學習的小建議

1.1 Deciding what to try next 當你除錯你的學習演算法時，當面對測試集你的演算法效果不佳時，你會怎麼做呢？獲得更多的訓練樣本？嘗試更少的特徵？嘗試獲取附加的特徵？嘗試增加多項式的特徵？嘗試增加λ? 嘗試減小λ?

Coursera吳恩達機器學習課程總結筆記及作業程式碼——第5周神經網路續

Neural Networks:Learning 上週的課程學習了神經網路正向傳播演算法，這周的課程主要在於神經網路的反向更新過程。 1.1 Cost function 我們先回憶一下邏輯迴歸的價值函式 J(θ)=1m[∑mi=1y(i)log(hθ

Coursera吳恩達機器學習課程總結筆記及作業程式碼——第1,2周

Linear’regression 發現這個教程是最入門的一個教程了，老師講的很好，也很通俗，每堂課後面還有程式設計作業，全程用matlab程式設計，只需要填寫核心程式碼，很適合自學。 1.1 Model representation 起始給出了

吳恩達 DeepLearning.ai 課程提煉筆記（4-2）卷積神經網絡 --- 深度卷積模型

mes and shift abd actual 應用比賽特征通道 1. 經典的卷積網絡介紹幾種經典的卷積神經網絡結構，分別是LeNet、AlexNet、VGGNet。 LeNet-5： LeNet-5主要是針對灰度設計的，所以其輸入較小，為，其結構如下：

吳恩達deeplearning.ai課程系列筆記05（下）

#寫在最前，deeplearning.ai系列課程相較於之前的Andrew Ng在coursera上2014釋出的機器學習課程內容更加豐富。重要的是此次課程示例程式碼都是用python來實現，不需要去熟悉octave，對大部分需要用python來學習機器學習的同學來說

吳恩達deeplearning.ai課程系列筆記09

吳恩達deeplearning.ai課程系列筆記06

#寫在最前，deeplearning.ai系列課程相較於之前的Andrew Ng在coursera上2014釋出的機器學習課程內容更加豐富。重要的是此次課程示例程式碼都是用python來

吳恩達deeplearning.ai課程系列筆記01

#寫在最前，deeplearning.ai系列課程相較於之前的Andrew Ng在coursea上2014釋出的機器學習課程內容更加豐富。重要的是此次課程示例程式碼都是用python來實現，

Coursera吳恩達機器學習課程第一週測驗2（單變數線性迴歸）

Machine Learning Week 1 Quiz 2 (Linear Regression with One Variable) Stanford Coursera Question 1 Consider the problem of predi

Coursera吳恩達機器學習課程-第五章

五、Octave教程(Octave Tutorial) 5.1 基本操作參考視訊: 5 - 1 - Basic Operations (14 min).mkv 在這段視訊中，我將教你一種程式語言：Octave語言。你能夠用它來非常迅速地實現這門課中我們已經學過的，或者

Coursera-吳恩達-機器學習-（程式設計練習8）異常檢測和推薦系統（對應第9周課程）

exercise 8 —— 異常檢測和推薦系統在本練習中，第一部分，您將實施異常檢測演算法並將其應用於檢測網路上發生故障的伺服器。在第二部分中，您將使用協作過濾來構建電影的推薦系統。 1 異常檢測在這個練習中，您將實現一個異常檢測演算

Coursera-吳恩達-機器學習-（程式設計練習7）K均值和PCA（對應第8周課程）

exercise 7 —— K-means and PCA 在本練習中，您將實現K均值聚類演算法並將其應用於壓縮影象。在第二部分中，您將使用主成分分析來查詢面部影象的低維表示。 1 K-means 先從二維的點開始，使用K-means進行分類

Coursera-吳恩達-機器學習-第七週-測驗-Support Vector Machines

忘記截圖了，做了二次的，有點繞這裡，慢點想就好了。正確選項是，It would be reasonable to try increasing C. It would also be reasonable to try decreasing σ2. &n

Coursera-吳恩達-機器學習-第七週-程式設計作業: Support Vector Machines

本次文章內容： Coursera吳恩達機器學習課程，第七週程式設計作業。程式語言是Matlab。本文只是從程式碼結構上做的小筆記，更復雜的推導不在這裡。演算法分兩部分進行理解，第一部分是根據code對演算法進行綜述，第二部分是程式碼。本次作業分兩個part，第一個是using SVM，第

Coursera-吳恩達-機器學習-第十一週-測驗-Application: Photo OCR

本片文章內容： Coursera吳恩達機器學習課程，第十一週 Application: Photo OCR 部分的測驗，題目及答案截圖。 1000*1000，每次移動2畫素，總共是500*500=250000次，兩個視窗是500000次。 &nb

Coursera-吳恩達-機器學習-第十週-測驗-Large Scale Machine Learning

本片文章內容： Coursera吳恩達機器學習課程，第十週 Large Scale Machine Learning 部分的測驗，題目及答案截圖。 1.cost increase ，說明資料diverge。減小learning rate。 stochastic不需要每步都是減

Coursera-吳恩達-機器學習-第九周-程式設計作業-Anomaly Detection and Recommender Systems

本次文章內容： Coursera吳恩達機器學習課程，第九周程式設計作業。程式語言是Matlab。本文只是從程式碼結構上做的小筆記。 Anomaly Detection part 0 Initialization Part 1: Load Example

Coursera-吳恩達-機器學習-第九周-測驗-Recommender Systems

本片文章內容： Coursera吳恩達機器學習課程，第九周Recommender Systems部分的測驗，題目及答案截圖。注：區分迴歸的預測和collaborative filtering預測的區別，後者涉及到一些分類。注：可以結合不同的trai

Coursera-吳恩達-機器學習-第八週-程式設計作業: K-Means Clustering and PCA

本次文章內容： Coursera吳恩達機器學習課程，第八週程式設計作業。程式語言是Matlab。本文只是從程式碼結構上做的小筆記，更復雜的推導不在這裡。演算法分兩部分進行理解，第一部分是根據code對演算法進行綜述，第二部分是程式碼。本次作業分兩個part，第一個是K-Means Clu

Coursera-吳恩達-機器學習-第八週-測驗-Principal Component Analysis

本片文章內容： Coursera吳恩達機器學習課程，第八週的測驗，題目及答案截圖。

Coursera吳恩達機器學習課程 總結筆記及作業程式碼——第6周有關機器學習的小建議

1.1 Deciding what to try next

1.2 EvaluaDng a hypothesis

1.3 Model selecDon and training/validaDon/test sets

1.4 Diagnosing bias vs variance

1.5 Regularization and bias/variance

1.6 Learning curves

2.1 Machine learning system design

相關推薦

Coursera吳恩達機器學習課程總結筆記及作業程式碼——第6周有關機器學習的小建議