吳恩達第一課第三周隨筆

阿新 • • 發佈：2018-07-15

imu tro 廣播最終表示調用大小有關使用

2.1 雙層神經網絡

技術分享圖片

圖 1

技術分享圖片

圖 2

圖1是一個雙層網絡模型，實際上有三層，但是通常把輸入層給忽略掉技術分享圖片稱為輸入層

註意技術分享圖片層了，圖1層有4個節點，圖2只要1個，

所以圖1 技術分享圖片應該是一個（4,3）的矩陣，圖2的是一個（1,3）的矩陣

ps：堅持將前一層的特征的權重技術分享圖片做成一列放入矩陣中，所以每一個都是（3,1）的列向量

以前一直都是使用，np.dot( 技術分享圖片 .T,X),這裏也同樣也沿用這個設定

所以技術分享圖片，所以是一個（4,3）矩陣

技術分享圖片，b是一個[4,1]的列向量，要生成矩陣節點在前

圖1的正向傳播算法：

技術分享圖片

A,Z的橫向表示第幾個樣本，豎向表示第幾個節點

2.2理解m個樣本向量化

重點在於np.dot這個函數，向量的點積運算

C=np.dot(A,B)

技術分享圖片

這是點積運算的定義（下面的W值得是技術分享圖片）

W是一個（4,3）的矩陣，表示總共有 4行3個特征權重組成的權重矩陣

X是一個（3，m）的矩陣，表示有m個樣本，每個樣本有3個特征

技術分享圖片觀察z的計算形成，x的每一個特征與對應的權重相乘並累加

3個 x特征技術分享圖片權重相乘並累加成一個值，這個值就是

由於有4行這樣的權重值，每一行的權重值都與第i個樣本的3個特征相乘就形成了一個4為列向量如技術分享圖片

最終W與X點積，形成一個（4，m）的矩陣。至於+b就是numpy的廣播功能了

註意b是一個(4,1)的列向量，每一個節點都有對應的b值即技術分享圖片

2.3 更多的激活函數

技術分享圖片

優點：平均值接近0，比起sigmod接近0.5的平均值，接近0，更易於下一層的計算

tanh各方面吊打sigmod，除了作為二分分類輸出層時，才會使用sigmod作為作為激活函數

缺點：兩個函數，都在Z很大的時候，梯度都接近0，這樣會拖慢學習速率。梯度下降與學習率技術分享圖片以及梯度有關。

另外一個激活函數：relu函數 np.maximum(0,z), 比較0，和Z和大小，取大的

技術分享圖片特點：

1. 在Z>0時，梯度永遠為1，

2. 在Z=0時，梯度為0，不過，你可以設置當Z=0時，梯度為多少

3. 缺點：當Z為負數時，順帶的也把梯度變成0了，不好使用梯度下降的方法

這個激活函數很強大，就是這麽強，當不知道選用什麽激活函數時，就選這個reluc函數（修正線性函數）

帶泄露的relu函數：np.maximum(0.01Z,Z)，他會在負值有一個平緩的線條，讓其也有梯度

技術分享圖片為了表示清楚，選用的是0.1。 0.01是經驗總結出來的一個參數

建立神經網絡有一系列東西需要選擇，如隱藏單元個數，激活函數，初始化

這些東西全靠經驗選擇出的，選擇困難戶

2.4 非線性激活函數的必要性

如果去掉非線性激活函數，那麽你的輸出與輸入還是一個成線性關系，那麽你後面的無論有多少隱藏層，都會等價於只做了一個線性輸出。

在輸出層會有可能需要做線性變換，才會用到線性激活函數。

中間隱藏層，如果需要做一些伸縮變化，也會用到線性激活函數（這種情況很復雜）

2.5 激活函數的導數

技術分享圖片

註釋：技術分享圖片

記住：a=tanh(z) a^‘=1-a²

Relu函數以及帶泄露的Relu函數：記住在z=0處是沒有導數的，因為左右的偏導不相等，需要自己定義

2.6 神經網絡下的梯度下降

技術分享圖片

正反向傳播公式計算

正向請翻上面

假設這是一個二分分類的雙層神經網絡

技術分享圖片

註意點：

是一個列向量，在橫向累加，所以axis=1，為了確保累加之後不會出現一個秩為1的數組，所以調用keepdims=True
計算時，與是對應為相乘，不再是點積了
是一個(1,4)轉置之後是一個（4,1），是一個（1，m），點積之後變成（4，m）
是一個(4,m)矩陣，對應位相乘。這是從矩陣形狀來看
dZ_1的計算並不需要累加，且不需要累加到m，然後除以m

還剩下一個隨機初始化權重，留到明天學習

吳恩達第一課第三周隨筆

imu tro 廣播最終表示調用大小有關使用 2.1 雙層神經網絡圖 1 圖 2 圖1是一個雙層網絡模型，實際上有三層，但是通常把輸入層給忽略掉稱為輸入層註意層了，圖1層有4個節點，圖2只要1個，所以圖1 應該是一個（4,3）的矩陣，圖2的是

深度學習-吳恩達第一課第三週課程作業

第二週的課程作業是利用邏輯迴歸來訓練一個分類器來辨別一張圖片是否為貓，這周老師講了單隱層的神經網路，所以先看看利用這個模型能否在上次作業的基礎上對訓練準確度作出改善訓練一個神經網路神經網路分為幾層，隱藏層中包含幾個神經元，使用的啟用函式初始化引數 W（i）和

深度學習-吳恩達第一課第四周課程作業

在前面兩節課的基礎上，這次作業是訓練一個N層神經網路，來判斷一張圖片是否有貓，實現過程其實和第三週很相似，因為層數不確定，所以在向前傳播和反向傳播的時候會用到for迴圈，程式碼相對而言反而更精簡了。貼出的程式碼可能和老師給的模板不一樣，我沒有看到老師的原版課程作業，也是在網上

tensorflow+ tutorial 吳恩達第二課第三週作業

TensorFlow Tutorial Welcome to this week's programming assignment. Until now, you've always used numpy to build neural networks. Now we will step you

吳恩達實驗（神經網絡和深度學習）第一課第三周，代碼和數據集，親測可運行

HR tps size nac www cond -c 自己 c-c 代碼和數據集已上傳到文件中應該可以直接下載吧（第一次上傳文件，感覺是），解壓後把文件夾拷貝到jupyter工作空間即可註：我對下載的代碼的格式稍作了修改，原來定義函數與調用函數在兩個單元格裏，我直

吳恩達機器學習第5周Neural Networks（Cost Function and Backpropagation）

and div bsp 關於邏輯回歸 info src clas 分享 5.1 Cost Function 假設訓練樣本為：{(x1),y(1)),(x(2),y(2)),...(x(m),y(m))} L = total no.of layers in network

吳恩達機器學習第三週

轉載https://www.cnblogs.com/LoganGo/p/8562575.html 一.邏輯迴歸問題（分類問題）生活中存在著許多分類問題，如判斷郵件是否為垃圾郵件；判斷腫瘤是惡性還是良性等。機器學習中邏輯迴歸便是解決分類問題的一種方法。二分類：通常表示為yϵ{0,1}

機器學習 | 吳恩達機器學習第三週程式設計作業(Python版)

實驗指導書下載密碼:fja4 本篇部落格主要講解，吳恩達機器學習第三週的程式設計作業，作業內容主要是利用邏輯迴歸演算法(正則化)進行二分類。實驗的原始版本是用Matlab實現的，本篇部落格主要用Python來實現。目錄 1.實驗包含的檔案 2.使用邏

Coursera-吳恩達-機器學習-第九周-程式設計作業-Anomaly Detection and Recommender Systems

本次文章內容： Coursera吳恩達機器學習課程，第九周程式設計作業。程式語言是Matlab。本文只是從程式碼結構上做的小筆記。 Anomaly Detection part 0 Initialization Part 1: Load Example

Coursera-吳恩達-機器學習-第九周-測驗-Recommender Systems

本片文章內容： Coursera吳恩達機器學習課程，第九周Recommender Systems部分的測驗，題目及答案截圖。注：區分迴歸的預測和collaborative filtering預測的區別，後者涉及到一些分類。注：可以結合不同的trai

深度學習-吳恩達第一課第二週課程作業

這周作業是，給出一張圖片，判斷這張圖是不是貓。這是一個二分類問題，結果是非0即1的，使用邏輯迴歸（Logic Regression），可以說，瞭解這個迴歸方法，有些python基礎，會使用jupyter notebook就可以嘗試著碼一遍程式碼，走完整個學習流程，能進一步

機器學習 | 吳恩達機器學習第三週學習筆記

第三週PPT彙總下載連結:https://pan.baidu.com/s/101uY5KV_2i3Ey516DYma_A 密碼:8o4e 上一篇部落格主要介紹了第二週的課程的內容，包括多變數線性迴歸，使用梯度下降法求解多變數線性迴歸的實用技巧，特徵縮放與模型特徵選擇並

吳恩達 deep learning 第三週淺層神經網路

文章目錄神經網路概覽神經網路的表示計算神經網路的輸出多個例子中的向量化啟用函式為什麼需要非線性啟用函式啟用函式的導數神經網路的梯度下降

吳恩達 DeepLearning 神經網路基礎第一課第三週程式設計題目及作業

宣告此周的作業放在下面的連結那裡，裡面包含了所有資料。作業連結在一些程式碼上我寫上了註釋，再次明確了建立一個模型的步驟，此作業由於並不是很複雜，所以一些步驟合併了，但是總體的建模步驟還是跟部

吳恩達深度學習第一課第三週課後作業

Planar data classification with one hidden layer Welcome to your week 3 programming assignment. It’s time to build your first

吳恩達深度學習第一課第三週 bug plt.scatter

error 1： # plt.scatter(X[0,:],X[1,:],c=np.squeeze(Y),s=40,cmap=plt.cm.Spectral) plt.scatter(X[0,

吳恩達第一門-神經網路和深度學習第三週6-10學習筆記

吳恩達第一門-神經網路和深度學習第三週6-10學習筆記 3.6啟用函式啟用函式圖中給出了前面課程中所學到的利用神經網路計算輸出值的具體步驟。其中的 σ

吳恩達Deeplearning.ai 第五課 Sequence Model 第一週------Deep RNNs

這一節主要講解了深度RNN網路的結構。左邊是在一般的神經網路中DNN的結構，由輸入經過多層網路最終得到輸出與此類似，Deep RNN也有類似的結構，之前的RNN網路都只是一層，如圖畫出了三層。用a[l]<t>來表示第l層激勵的第t個t

Coursera 吳恩達 Deep Learning 第2課 Improving Deep Neural Networks 第一週程式設計作業程式碼 Regularization

2 - L2 Regularization # GRADED FUNCTION: compute_cost_with_regularization def compute_cost_with_reg

吳恩達Deeplearning.ai 第五課 Sequence Model 第一週------Sampling novel sequence

這一節主要講了如何從一個訓練好的RNN中進行取樣得到序列從訓練好的RNN中取樣出一個序列之前在序列產生中講到，首先RNN輸入a<0>(0向量)和x<1>(0向量)，通過一個RNN cell產生一個輸出y。 y = softm

吳恩達第一課第三周隨筆

相關推薦