吳恩達Coursera深度學習課程 deeplearning.ai (3-1) 機器學習(ML)策略（1）--課程筆記

阿新 • • 發佈：2019-02-20

1.1 為什麼是 ML 策略

實踐中優化深度學習模型的方法有好多種，應該如何抉擇?

1.2 正交化

正交化： 一個維度做且只做一件事，各個維度相互獨立，不影響其他維度做的事情。

比如電視條件：有調節高度的按鈕，寬度的按鈕，旋轉的按鈕，
色彩的按鈕，亮度的按鈕，每個按鈕負責一件事情，不會影響其他按鈕調節的維度，使分析更為簡單。

監督學習模型中：

系統在訓練集上表現的好
- 否則，使用更大的神經網路、更好的優化演算法
系統在開發集上表現的好
- 否則，使用正則化、更大的訓練集
系統在測試集上表現的好
- 否則，使用更大的開發集
在真實的系統環境中表現的好
- 否則，修改開發測試集、修改代價函式

1.3 單一數字評估指標

如果用多個指標去評估各個系統的表現，很難抉擇，因為各有利弊。

應該嘗試去設定一個合理的單一實數評估指標，所有系統都通過這一個指標來評估好壞，問題就會簡單的多，迭代速度也會加快。

例如：

查準率（Precision）：計算結果中 true 的個數除以計算結果的個數
查全率（Recall）: 計算結果中true的個數除以全集中真實true的個數
F1 Score：查準率和查全率的調和平均數

$F 1_s o r c e = \frac{2}{\frac{1}{p r e c i s i o n} + \frac{1}{r e c a l l}}$
選擇單一的F1作為評估指標表現更好。

1.4 滿足和優化指標

對於某一問題，如要求模型準確率儘可能的高，執行時間在100 ms以內。這裡以Accuracy為優化指標，以Running time為滿足指標，我們可以從中選出B是滿足條件的最好的分類器。

一般的，如果要考慮N個指標，則選擇一個指標為優化指標，其他N-1個指標都是滿足指標：

N_{m e t r i c} : {\begin{cases} 1 O p t i m i z i n g m a t i r c \\ N_{m e t i r c} - 1 S a t i s i f i c i n g m a t r i c \end{cases}

1.5 訓練/開發/測試集劃分

所選擇的開發集和測試集中的資料，要與未來想要或者能夠得到的資料類似，即模型資料和未來資料要具有相似性

在選擇開發集和測試集時要使二者來自同一分佈，且從所有資料中隨機選取

1.6 開發集合測試集的大小

開發驗證集dev 和單一評估指標一起確定了模型的訓練目標。

傳統劃分

資料量小：100-10000
70/30
60/20/20

大資料劃分：

資料量大：>1000000
98/1/1
99/0.5/0.5

測試集: 評測效能指標：10000或100000 足夠了
如果不需要評估效能指標，甚至可以沒有測試集(不推薦)

在沒有測試集時，只有train/dev 但是人們習慣說成train/test，我們應該知道這裡的test其實指的是dev。

1.7 什麼時候該改變開發/測試集和指標

如果評估指標無法正確評估演算法的排名(排名與真實場景不符)，則需要重新定義一個新的評估指標。
如果在訓練開發測試的過程中得到的模型效果比較好，但是在實際應用中自己所真正關心的問題效果卻不好的時候（資料與真實場景不符），就需要改變開發、測試集或者評估指標。

上面七個小節講的是單一實數評估指標和模型優化，這兩個正像是兩個正交化的維度，互相獨立。

1.8 為什麼是人的表現

我們習慣於將機器學習的表現與人類的表現作比較。

通常我們發現，機器學習的效果在初始訓練時提升很快，但是一旦超過了人類的效果，則上升變得緩慢，最終達到理論最優（不是實際最優），這個理論最優的誤差稱為貝葉斯誤差。

造成這種現象的原因可能有以下幾種：當比人類表現差時

讓人們幫忙標記資料
錯誤分析，比人差到哪裡了
分析偏差和方差

1.9 可避免偏差

一般我們不用貝葉斯誤差去衡量偏差，而是用人類的表現去衡量。

偏差：訓練集的錯誤
可避免偏差：訓練集的錯誤與人類的錯誤的差
方差: 開發驗證集的錯誤與訓練集錯誤的差

比較可避免偏差和方差，看改進哪個對模型進步更有意義。

1.10 理解人的表現

普通人和領域專家以及領域專家組對於一個問題的表現不同，如何定義人類的標準？一般看你的目的是什麼，如果想做到最好，那就用領域專家組的標準，如果只是為了發表論文或部署上線，使用專家的標準即可，主要看你的目的是什麼。

對人類水平誤差有一個大概的估計，可以讓我們去估計貝葉斯誤差，這樣可以讓我們更快的做出決定：減少偏差還是減少方差。
而這個決策技巧通常都很有效果，直到系統的效能開始超越人類，那麼我們對貝葉斯誤差的估計就不再準確了，再從減少偏差和減少方差方面提升系統性能就會比較困難了。

1.11 超過人的表現

在架構化資料的模型中，機器學習系統的表現很容易超過人類

點選率預估
推薦演算法
物流預測
銀行貸款審批

在自然感知的模型中，人類比較擅長，機器學習想要超過人類就比較困難，不過也有一些機器學習系統的表現已經超過了人類。

1.12 改善你的模型的表現

基本假設

模型在訓練集上有很好的表現
模型推廣到開發和測試集啥會給你也有很好的表現

減少可避免偏差

訓練更大的模型
訓練更長時間、訓練更好的優化演算法（Momentum、RMSprop、Adam）
尋找更好的網路架構（RNN、CNN）、尋找更好的超引數

減少方差

收集更多的資料
正則化（L2、dropout、資料增強）
尋找更好的網路架構（RNN、CNN）、尋找更好的超引數

吳恩達Coursera深度學習課程 deeplearning.ai (5-3) 序列模型和注意力機制--程式設計作業(二)：觸發字檢測

Part 2: 觸發字檢測關鍵詞語音喚醒觸發字檢測歡迎來到這個專業課程的最終程式設計任務！在本週的視訊中，你瞭解瞭如何將深度學習應用於語音識別。在本作業中，您將構建一個語音資料集並實現觸發字檢測演算法（有時也稱為關鍵字檢測或喚醒檢測）。觸發字

吳恩達Coursera深度學習課程 deeplearning.ai (4-1) 卷積神經網路--程式設計作業

Part 1：卷積神經網路本週課程將利用numpy實現卷積層(CONV) 和池化層(POOL), 包含前向傳播和可選的反向傳播。變數說明上標[l][l] 表示神經網路的第幾層上標(i)(i) 表示第幾個樣本上標[i][i] 表示第幾個mi

吳恩達Coursera深度學習課程 DeepLearning.ai 程式設計作業——Regularization（2-1.2）

如果資料集沒有很大，同時在訓練集上又擬合得很好，但是在測試集的效果卻不是很好，這時候就要使用正則化來使得其擬合能力不會那麼強。 import numpy as np import sklearn import matplotlib.pyplot as plt

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（1-2）-- 神經網路基礎

以下為在Coursera上吳恩達老師的DeepLearning.ai課程專案中，第一部分《神經網路和深度學習》第二週課程部分關鍵點的筆記。筆記並不包含全部小視訊課程的記錄，如需學習筆記中捨棄的內容請至Coursera 或者網易雲課堂。同時在閱讀以下

吳恩達Coursera深度學習課程 deeplearning.ai (4-1) 卷積神經網路--課程筆記

本課主要講解了卷積神經網路的基礎知識，包括卷積層基礎（卷積核、Padding、Stride），卷積神經網路的基礎：卷積層、池化層、全連線層。主要知識點卷積核: 過濾器，各元素相乘再相加 nxn * fxf -> (n-f+1)x(n-f+1)

吳恩達Coursera深度學習課程 deeplearning.ai (4-4) 人臉識別和神經風格轉換--課程筆記

Part 1：人臉識別 4.1 什麼是人臉識別？人臉驗證: 輸入圖片，驗證是不是 A 人臉識別: 有一個庫，輸入圖片，驗證是不是庫裡的一員人臉識別難度更大，要求準確率更高，因為1%的人臉驗證錯誤在人臉識別中會被放大很多倍。 4.2 O

吳恩達Coursera深度學習課程 deeplearning.ai (5-1) 迴圈序列模型--程式設計作業(一)：構建迴圈神經網路

Part 1: 構建神經網路歡迎來到本週的第一個作業，這個作業我們將利用numpy實現你的第一個迴圈神經網路。迴圈神經網路(Recurrent Neural Networks: RNN) 因為有”記憶”，所以在自然語言處理(Natural Languag

吳恩達Coursera深度學習課程 deeplearning.ai (5-1) 迴圈序列模型--課程筆記

1.1 為什麼選擇序列模型序列模型的應用語音識別：將輸入的語音訊號直接輸出相應的語音文字資訊。無論是語音訊號還是文字資訊均是序列資料。音樂生成：生成音樂樂譜。只有輸出的音樂樂譜是序列資料，輸入可以是空或者一個整數。情感分類：將輸入的評論句子轉換

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（5-1）-- 迴圈神經網路

Ng最後一課釋出了，撒花！以下為吳恩達老師 DeepLearning.ai 課程專案中，第五部分《序列模型》第一週課程“迴圈神經網路”關鍵點的筆記。同時我在知乎上開設了關於機器學習深度學習的專欄收錄下面的筆記，以方便大家在移動端的學習。歡迎關

吳恩達Coursera深度學習課程 deeplearning.ai (5-3) 序列模型和注意力機制--課程筆記

3.1 基礎模型 sequence to sequence sequence to sequence：兩個序列模型組成，前半部分叫做編碼，後半部分叫做解碼。用於機器翻譯。 image to sequence sequence to sequenc

吳恩達Coursera深度學習課程 DeepLearning第一課第二週程式設計作業

最近在學習吳恩達的Deep Learning 系列課程，首先在此對吳老師表示深深的謝意。第一次接觸深度學習方面的知識，更是第一次用程式碼程式設計實現深度學習的演算法。所以在完成老師的作業過程中，遇到很多問題，最終在度孃的幫助下，花了一天的時間，終於把程式設計實現了邏

吳恩達Coursera深度學習課程 deeplearning.ai (5-2) 自然語言處理與詞嵌入--程式設計作業(一)：詞向量運算

Part 1: 詞向量運算歡迎來到本週第一個作業。由於詞嵌入的訓練計算量龐大切耗費時間長，絕大部分機器學習人員都會匯入一個預訓練的詞嵌入模型。你將學到：載入預訓練單詞向量，使用餘弦測量相似度使用詞嵌入解決類別問題，比如 “Man is to

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（5-3）-- 序列模型和注意力機制

完結撒花！以下為吳恩達老師 DeepLearning.ai 課程專案中，第五部分《序列模型》第三週課程“序列模型和注意力機制”關鍵點的筆記。同時我在知乎上開設了關於機器學習深度學習的專欄收錄下面的筆記，以方便大家在移動端的學習。歡迎關注我的知

吳恩達Coursera深度學習課程 deeplearning.ai (4-2) 深度卷積網路：例項探究--課程筆記

本課主要講解了一些典型的卷積神經網路的思路，包括經典神經網路的leNet/AlexNet/VGG, 以及殘差網路ResNet和Google的Inception網路，順便講解了1x1卷積核的應用，便於我們進行學習和借鑑。 2.1 為什麼要進行例項探究神經

吳恩達Coursera深度學習課程 deeplearning.ai (2-1) 深度學習實踐--程式設計作業

初始化一個好的初始化可以做到：梯度下降的快速收斂收斂到的對訓練集只有較少錯誤的值載入資料 import numpy as np import matplotlib.pyplot as plt import sklearn impo

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（1-3）-- 淺層神經網路

以下為在Coursera上吳恩達老師的DeepLearning.ai課程專案中，第一部分《神經網路和深度學習》第三週課程“淺層神經網路”部分關鍵點的筆記。筆記並不包含全部小視訊課程的記錄，如需學習筆記中捨棄的內容請至Coursera 或者網易雲課堂

吳恩達Coursera深度學習課程 deeplearning.ai (4-4) 人臉識別和神經風格轉換--程式設計作業

Part 1：Happy House 的人臉識別本週的第一個作業我們將完成一個人臉識別系統。人臉識別問題可以分為兩類：人臉驗證: 輸入圖片，驗證是不是A 1:1 識別舉例：人臉解鎖手機，人臉刷卡人臉識別: 有一個庫，輸入圖片，驗證是不是庫裡的

吳恩達Coursera深度學習課程 deeplearning.ai (5-2) 自然語言處理與詞嵌入--程式設計作業(二)：Emojify表情包

Part 2: Emojify 歡迎來到本週的第二個作業，你將利用詞向量構建一個表情包。你有沒有想過讓你的簡訊更具表現力？ emojifier APP將幫助你做到這一點。所以不是寫下”Congratulations on the promotion! L

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（1-4）-- 深層神經網路

以下為在Coursera上吳恩達老師的DeepLearning.ai課程專案中，第一部分《神經網路和深度學習》第四周課程“深層神經網路”部分關鍵點的筆記。筆記並不包含全部小視訊課程的記錄，如需學習筆記中捨棄的內容請至 Coursera 或者網易雲課

吳恩達Coursera深度學習課程 DeepLearning.ai 程式設計作業——Convolution model:step by step and application (4.1)

一.Convolutional Neural Networks: Step by Step Welcome to Course 4’s first assignment! In this assignment, you will implement convol