吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（1-2）-- 神經網路基礎

以下為在Coursera上吳恩達老師的DeepLearning.ai課程專案中，第一部分《神經網路和深度學習》第二週課程部分關鍵點的筆記。筆記並不包含全部小視訊課程的記錄，如需學習筆記中捨棄的內容請至Coursera 或者網易雲課堂。同時在閱讀以下筆記之前，強烈建議先學習吳恩達老師的視訊課程。

同時我在知乎上開設了關於機器學習深度學習的專欄收錄下面的筆記，方便在移動端的學習。歡迎關注我的知乎：大樹先生。一起學習一起進步呀！^_^

神經網路和深度學習—神經網路基礎

1. 二分類問題

對於二分類問題，大牛給出了一個小的Notation。

樣本：(x,y)，訓練樣本包含m個；

其中x∈Rnx，表示樣本x 包含nx個特徵；
y∈0,1，目標值屬於0、1分類；
訓練資料：{(x(1),y(1)),(x(2),y(2)),⋯,(x(m),y(m))}

輸入神經網路時樣本資料的形狀：

X.shape=(nx,m)

目標資料的形狀：

Y=[y(1),y(2),⋯,y(m)]

Y.shape=(1,m)

2. logistic Regression

邏輯迴歸中，預測值：

h^=P(y=1|x)
其表示為1的概率，取值範圍在[0,1]之間。

引入Sigmoid函式，預測值：

y^=Sigmoid(wTx+b)=σ(wTx+b)其中
Sigmoid(z

)=11+e−z

注意點：函式的一階導數可以用其自身表示，

σ′(z)=σ(z)(1−σ(z))

這裡可以解釋梯度消失的問題，當z=0時，導數最大，但是導數最大為σ′(0)=σ(0)(1−σ(0))=0.5(1−0.5)=0.25，這裡導數僅為原函式值的0.25倍。

引數梯度下降公式的不斷更新，σ′(z)會變得越來越小，每次迭代引數更新的步伐越來越小，最終接近於0，產生梯度消失的現象。

3. logistic迴歸損失函式

Loss function

一般經驗來說，使用平方錯誤（squared error）來衡量Loss Function：

L(y^,y)=12(y^−y)2

但是，對於logistic regression 來說，一般不適用平方錯誤來作為Loss Function，這是因為上面的平方錯誤損失函式一般是非凸函式（non-convex），其在使用低度下降演算法的時候，容易得到區域性最優解，而不是全域性最優解。因此要選擇凸函式。

邏輯迴歸的Loss Function：

L(y^,y)=−(ylogy^+(1−y)log(1−y^))

當y=1時，L(y^,y)=−logy^。如果y^越接近1，L(y^,y)≈0，表示預測效果越好；如果y^越接近0，L(y^,y)≈+∞，表示預測效果越差；
當y=0時，L(y^,y)=−log(1−y^)。如果y^越接近0，L(

相關推薦

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（1-2）-- 神經網路基礎

以下為在Coursera上吳恩達老師的DeepLearning.ai課程專案中，第一部分《神經網路和深度學習》第二週課程部分關鍵點的筆記。筆記並不包含全部小視訊課程的記錄，如需學習筆記中捨棄的內容請至Coursera 或者網易雲課堂。同時在閱讀以下

Coursera深度學習課程 DeepLearning.ai 提煉筆記（1-2）-- 神經網路基礎

以下為在Coursera上吳恩達老師的DeepLearning.ai課程專案中，第一部分《神經網路和深度學習》第二週課程部分關鍵點的筆記。筆記並不包含全部小視訊課程的記錄，如需學習筆記中捨棄的內容請至Coursera 或者網易雲課堂。同時在閱讀以下筆記之前，

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（1-3）-- 淺層神經網路

以下為在Coursera上吳恩達老師的DeepLearning.ai課程專案中，第一部分《神經網路和深度學習》第三週課程“淺層神經網路”部分關鍵點的筆記。筆記並不包含全部小視訊課程的記錄，如需學習筆記中捨棄的內容請至Coursera 或者網易雲課堂

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（1-4）-- 深層神經網路

以下為在Coursera上吳恩達老師的DeepLearning.ai課程專案中，第一部分《神經網路和深度學習》第四周課程“深層神經網路”部分關鍵點的筆記。筆記並不包含全部小視訊課程的記錄，如需學習筆記中捨棄的內容請至 Coursera 或者網易雲課

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（4-2）-- 深度卷積模型

以下為在Coursera上吳恩達老師的 DeepLearning.ai 課程專案中，第四部分《卷積神經網路》第二週課程“深度卷積模型”關鍵點的筆記。本次筆記幾乎涵蓋了所有視訊課程的內容。在閱讀以下筆記的同時，強烈建議學習吳恩達老師的視訊課程，視訊請至

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（5-3）-- 序列模型和注意力機制

完結撒花！以下為吳恩達老師 DeepLearning.ai 課程專案中，第五部分《序列模型》第三週課程“序列模型和注意力機制”關鍵點的筆記。同時我在知乎上開設了關於機器學習深度學習的專欄收錄下面的筆記，以方便大家在移動端的學習。歡迎關注我的知

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（5-1）-- 迴圈神經網路

Ng最後一課釋出了，撒花！以下為吳恩達老師 DeepLearning.ai 課程專案中，第五部分《序列模型》第一週課程“迴圈神經網路”關鍵點的筆記。同時我在知乎上開設了關於機器學習深度學習的專欄收錄下面的筆記，以方便大家在移動端的學習。歡迎關

吳恩達Coursera深度學習課程 deeplearning.ai (5-3) 序列模型和注意力機制--程式設計作業(二)：觸發字檢測

Part 2: 觸發字檢測關鍵詞語音喚醒觸發字檢測歡迎來到這個專業課程的最終程式設計任務！在本週的視訊中，你瞭解瞭如何將深度學習應用於語音識別。在本作業中，您將構建一個語音資料集並實現觸發字檢測演算法（有時也稱為關鍵字檢測或喚醒檢測）。觸發字

吳恩達Coursera深度學習課程 deeplearning.ai (4-1) 卷積神經網路--程式設計作業

Part 1：卷積神經網路本週課程將利用numpy實現卷積層(CONV) 和池化層(POOL), 包含前向傳播和可選的反向傳播。變數說明上標[l][l] 表示神經網路的第幾層上標(i)(i) 表示第幾個樣本上標[i][i] 表示第幾個mi

吳恩達Coursera深度學習課程 DeepLearning.ai 程式設計作業——Regularization（2-1.2）

如果資料集沒有很大，同時在訓練集上又擬合得很好，但是在測試集的效果卻不是很好，這時候就要使用正則化來使得其擬合能力不會那麼強。 import numpy as np import sklearn import matplotlib.pyplot as plt

吳恩達Coursera深度學習課程 deeplearning.ai (4-1) 卷積神經網路--課程筆記

本課主要講解了卷積神經網路的基礎知識，包括卷積層基礎（卷積核、Padding、Stride），卷積神經網路的基礎：卷積層、池化層、全連線層。主要知識點卷積核: 過濾器，各元素相乘再相加 nxn * fxf -> (n-f+1)x(n-f+1)

吳恩達Coursera深度學習課程 deeplearning.ai (4-4) 人臉識別和神經風格轉換--課程筆記

Part 1：人臉識別 4.1 什麼是人臉識別？人臉驗證: 輸入圖片，驗證是不是 A 人臉識別: 有一個庫，輸入圖片，驗證是不是庫裡的一員人臉識別難度更大，要求準確率更高，因為1%的人臉驗證錯誤在人臉識別中會被放大很多倍。 4.2 O

吳恩達Coursera深度學習課程 deeplearning.ai (5-1) 迴圈序列模型--程式設計作業(一)：構建迴圈神經網路

Part 1: 構建神經網路歡迎來到本週的第一個作業，這個作業我們將利用numpy實現你的第一個迴圈神經網路。迴圈神經網路(Recurrent Neural Networks: RNN) 因為有”記憶”，所以在自然語言處理(Natural Languag

吳恩達Coursera深度學習課程 deeplearning.ai (5-1) 迴圈序列模型--課程筆記

1.1 為什麼選擇序列模型序列模型的應用語音識別：將輸入的語音訊號直接輸出相應的語音文字資訊。無論是語音訊號還是文字資訊均是序列資料。音樂生成：生成音樂樂譜。只有輸出的音樂樂譜是序列資料，輸入可以是空或者一個整數。情感分類：將輸入的評論句子轉換

吳恩達Coursera深度學習課程 deeplearning.ai (5-3) 序列模型和注意力機制--課程筆記

3.1 基礎模型 sequence to sequence sequence to sequence：兩個序列模型組成，前半部分叫做編碼，後半部分叫做解碼。用於機器翻譯。 image to sequence sequence to sequenc

吳恩達Coursera深度學習課程 deeplearning.ai (5-2) 自然語言處理與詞嵌入--程式設計作業(一)：詞向量運算

Part 1: 詞向量運算歡迎來到本週第一個作業。由於詞嵌入的訓練計算量龐大切耗費時間長，絕大部分機器學習人員都會匯入一個預訓練的詞嵌入模型。你將學到：載入預訓練單詞向量，使用餘弦測量相似度使用詞嵌入解決類別問題，比如 “Man is to

吳恩達Coursera深度學習課程 deeplearning.ai (4-2) 深度卷積網路：例項探究--課程筆記

本課主要講解了一些典型的卷積神經網路的思路，包括經典神經網路的leNet/AlexNet/VGG, 以及殘差網路ResNet和Google的Inception網路，順便講解了1x1卷積核的應用，便於我們進行學習和借鑑。 2.1 為什麼要進行例項探究神經

吳恩達Coursera深度學習課程 deeplearning.ai (2-1) 深度學習實踐--程式設計作業

初始化一個好的初始化可以做到：梯度下降的快速收斂收斂到的對訓練集只有較少錯誤的值載入資料 import numpy as np import matplotlib.pyplot as plt import sklearn impo

吳恩達Coursera深度學習課程 deeplearning.ai (4-4) 人臉識別和神經風格轉換--程式設計作業

Part 1：Happy House 的人臉識別本週的第一個作業我們將完成一個人臉識別系統。人臉識別問題可以分為兩類：人臉驗證: 輸入圖片，驗證是不是A 1:1 識別舉例：人臉解鎖手機，人臉刷卡人臉識別: 有一個庫，輸入圖片，驗證是不是庫裡的

吳恩達Coursera深度學習課程 deeplearning.ai (5-2) 自然語言處理與詞嵌入--程式設計作業(二)：Emojify表情包

Part 2: Emojify 歡迎來到本週的第二個作業，你將利用詞向量構建一個表情包。你有沒有想過讓你的簡訊更具表現力？ emojifier APP將幫助你做到這一點。所以不是寫下”Congratulations on the promotion! L