吳恩達深度學習課程學習總結

阿新 • • 發佈：2018-12-11

本文章主要總結吳恩達DeepLearning課程中所提到的一些機器學習策略

1、啟用函式

Sigmoid函式
tanh函式
ReLU函式

2、權重初始化

全零初始化的弊端：若權重初始化為0，則在訓練過程中，每個隱含層之間存在對稱性，即在訓練過程中，每個隱含層的求導等計算都相同，導致權值更新也相同，這使得多個隱含層實現相同的功能，使得多個隱含層的存在變得毫無意義
隨機初始化：為避免全零初始化帶來的弊端，將權重隨機初始化為很小的值。例如在使用sigmoid或tanh啟用函式時，權值越靠近0，目標值將更加靠近tanh或sigmoid函式上斜率較大的部分，使得在梯度下降時下降速度較快，可以增加其學習速度。
- $w= np.random.randn()*0.01$
- $b=np.zeros()$

3、超引數（Hyperparameter）

指的是除了網路權值w，偏置b之外的引數，Hyperparameter可以控制w與b

超引數有：學習率（learning rate）、隱含層層數（number of hidden layer）、隱含層節點數（number of hidden units）、啟用函式型別（choice of activation function）等......

調參過程如圖所示，不斷反覆直至模型效果最好

4、資料集處理

一般將資料集分為3部分：訓練集（training set）、驗證集（dev set）、測試集（test set）。

其中，三者的資料規模比例一般為60/20/20，若資料集的規模非常大，則驗證集與測試集的比例可相對縮小，將大部分資料用於訓練集中。

training set的作用是用於網路訓練
dev set的作用是用於交叉驗證，防止網路的過擬合
test set的作用是用於無偏估計

dev set 是網路在用於測試之前對於網路效能的一個估計，因此要求dev set與test set來自於同一分佈。

5、偏差（bias）與方差（variance）

欠擬合又叫高偏差，過擬合又叫高方差。

欠擬合是指training set error較高，過擬合指dev set error 相對於training set error較高。其中，training set error的高低是相對於人本身對樣本的識別效果，即最優誤差（optimal error | Bayes error）

在此處加入正則化的思想，正則化適用於解決overfitting的問題，由上面三個圖可看到，從左到右，分類的線是越來越扭曲的，分類效果最好的是中間的線，‘high bias’的圖中，網路偏向於一個線性網路，‘high variance’中，網路由於隱含層變數增加，使得網路非線性性增加，因此線變得過擬合，而通過適當減少隱含層變數來使得網路非線性性減少而又不至於變到線性的範疇，此為網路正則化的基本思想。實現方法有：(1) L2 Regularization；(2) Dropout

吳恩達深度學習課程學習總結

本文章主要總結吳恩達DeepLearning課程中所提到的一些機器學習策略 1、啟用函式 Sigmoid函式 tanh函式 ReLU函式 2、權重初始化全零初始化的弊端：若權重初始化為0，則在訓練過程中，每個隱含層之間存在對稱性，即在訓練過程中，每個隱含層的求導等

吳恩達-深度學習-課程筆記-3: Python和向量化( Week 2 )

有時指數檢查都是效果很快 -1 tro str 1 向量化( Vectorization ) 在邏輯回歸中，以計算z為例，z = w的轉置和x進行內積運算再加上b，你可以用for循環來實現。但是在python中z可以調用numpy的方法，直接一句z = np.d

吳恩達-深度學習-課程筆記-6: 深度學習的實用層面( Week 1 )

data 絕對值 initial 均值化 http 梯度下降法 ati lod 表示 1 訓練/驗證/測試集( Train/Dev/test sets ) 構建神經網絡的時候有些參數需要選擇，比如層數，單元數，學習率，激活函數。這些參數可以通過在驗證集上的表現好壞來進行選擇

吳恩達-深度學習-課程筆記-8: 超參數調試、Batch正則化和softmax( Week 3 )

erp 搜索給定 via 深度 mode any .com sim 1 調試處理( tuning process ) 如下圖所示，ng認為學習速率α是需要調試的最重要的超參數。其次重要的是momentum算法的β參數（一般設為0.9），隱藏單元數和mini-batch的

吳恩達深度學習專項課程2學習筆記/week2/Optimization Algorithms

sce 適應耗時 bubuko 優化算法 src bat -a 過程 Optimization algorithms 優化算法以加速訓練。 Mini-batch gradient descend Batch gradient descend：每一小步梯度下降否需要計算所

吳恩達深度學習專項課程3學習筆記/week2/Error analysis

ini 調整數據 class http 評估參數 pos 修正 Error analysis Carrying out error analysis Error analysis是手動分析算法錯誤的過程。通過一個例子來說明error analysis的過程。假設你在做

吳恩達深度學習總結(2)

DeaplearningAI01.weak3 回顧 Logistic Regression 淺層神經網路(只有一層隱藏單元) 網路中每個符號的含義啟用函式的選擇可選函式啟用函式的選擇使用非線性啟

吳恩達深度學習總結(1)

DeaplearningAI01.weak2 forward backward 本週主要介紹了神經網路中forward和backward的一般實現和向量實現。一般實現較為簡單，向量實現中存在一些疑點

吳恩達深度學習總結（15）

自然語言處理與詞嵌入詞彙表徵基於遷移學習訓練word embedding 步驟類比推理演算法 Embedding matrix skip gram CBOW 負取樣 GloVe

Elam的吳恩達深度學習課程筆記（一）

記憶力是真的差，看過的東西要是一直不用的話就會馬上忘記,於是乎有了寫部落格把學過的東西儲存下來，大概就是所謂的集鞏固，分享，後期查閱與一身的思想吧，下面開始正題深度學習概論什麼是神經網路什麼是神經網路呢，我們就以房價預測為例子來描述一個最簡單的神經網路模型。　　假設有6間

吳恩達深度學習筆記(15-21)總結-淺層神經網路總結

恩達老師的這一週的淺層神經網路總結，還是簡單的架構說明，但是還是要仔細讀哦！架構分為四部分：神經網路表示計算神經網路輸出啟用函式神經網路的梯度下降第一和第二部分：神經網路表示和計算神經網路輸出部分，由於本部分講的是淺層的網路輸出，所以就是隻有一個隱藏層的神經網路，你也

優化演算法（吳恩達深度學習課程）-- 2018.11.02筆記

優化演算法（吳恩達深度學習課程） batch梯度下降使用batch梯度下降時，每次迭代你都需要遍歷整個訓練集，可以預期每次成本都會下降，所以如果成本函式

吳恩達深度學習總結（11）

經典網路的學習 LeNet-5 上圖是LeNet-5的結構（來自吳恩達的課件，下面所有圖片均來自於吳恩達課件），該網路只有卷積層，pooling層和全連線層，pooling層使用的是均值池化，非線性啟用使用的是sigmoid/tanh，而不是現在最常用的Re

吳恩達深度學習總結（13）

人臉識別分類 Verification：一對一識別，給一張照片，看是否是給定的照片 Recognition：一對n識別，給一張照片看是否是資料庫中的人顯然 Recognition可以通過n次Verification完成 One-shot learnin

吳恩達深度學習系列課程筆記：卷積神經網路（一）

本系列文章將對吳恩達在網易公開課“深度學習工程師”微專業內容進行筆記總結，這一部分介紹的是“卷積神經網路”部分。 1、計算機視覺計算機視覺在我們還是生活中有非常廣泛的應用，以下幾個是最常見的例子：影象分類：可以對影象中的物體種類進行判斷，如確定影象中

《吳恩達深度學習工程師系列課程之——改善深層神經網路：超引數除錯、正則化以及優化》學習筆記

本課程分為三週內容：深度學習的使用層面優化演算法超引數除錯、Batch正則化和程式框架 WEEK1 深度學習的使用層面 1.建立神經網路時選擇：神經網路層數每層隱藏單元的個數學習率為多少各層採用的啟用函式為哪些 2

吳恩達深度學習課程deeplearning.ai課程作業：Class 1 Week 4 assignment4_2

吳恩達deeplearning.ai課程作業，自己寫的答案。補充說明： 1. 評論中總有人問為什麼直接複製這些notebook執行不了？請不要直接複製貼上，不可能執行通過的，這個只是notebook中我們要自己寫的那部分，要正確執行還需要其他py檔案，請

吳恩達深度學習課程第二課第一週第一次作業：用神經網路簡單預測結果

# coding: utf-8 # # Initialization # Welcome to the first assignment of "Improving Deep Neural Networks". # # Training your neural

吳恩達深度學習課程deeplearning.ai課程作業：Class 4 Week 3 Car detection

吳恩達deeplearning.ai課程作業，自己寫的答案。補充說明： 1. 評論中總有人問為什麼直接複製這些notebook執行不了？請不要直接複製貼上，不可能執行通過的，這個只是notebook中我們要自己寫的那部分，要正確執行還需要其他py檔案，

http://www.52nlp.cn/tag/tensorflow Andrew Ng (吳恩達) 深度學習課程小結 tensorflow

Dear Learners, We hope that you are enjoying Structuring Machine Learning Projects and your experience in the Deep Learning Specialization so far!

吳恩達深度學習課程學習總結

相關推薦