深度學習DeepLearning.ai系列課程學習總結：8. 多層神經網路程式碼實戰

阿新 • • 發佈：2019-02-11

轉載過程中，圖片丟失，程式碼顯示錯亂。

為了更好的學習內容，請訪問原創版本：

http://www.missshi.cn/api/view/blog/59ac0136e519f50d040001a7

Ps：初次訪問由於js檔案較大，請耐心等候（8s左右）

本節課中，我們將學習如何利用Python的來實現具有多個隱藏層的圖片分類問題。

這是本課程的第三個Python程式碼實踐，通過本節課的實踐，你將會一步步的建立一個多層神經網路模型。

此外，通過這次建立的多層神經網路模型，可以將之前的貓分類問題的準確率提升到80%。

本文學習完成後，希望你可以做到：

1. 使用非線性對映單元（例如ReLU）去改善你的模型。

2. 建立一個多個隱藏層的神經網路

3. 建立一個易於呼叫的模型類

第一步：引入相關的依賴包

import numpy as np
import time
import h5py
import matplotlib.pyplot as plt
import scipy
from PIL importImage
from testCases_v2 import*#提供了一些測試函式所有的資料和方法
from dnn_utils_v2 import sigmoid, sigmoid_backward, relu, relu_backward  #封裝好的方法
from dnn_app_utils_v2  
import*
%matplotlib inline
plt.rcParams['figure.figsize']=(5.0,4.0)# set default size of plots
plt.rcParams['image.interpolation']='nearest'
plt.rcParams['image.cmap']='gray'
%load_ext autoreload
%autoreload 2
np.random.seed(1)

其中，sigmoid函式如下：

def sigmoid(Z):
"""
    Implements the sigmoid activation in numpy 
    Arguments:
    Z -- numpy array of any shape
    Returns:
    A -- output of sigmoid(z), same shape as Z
    cache -- returns Z as well, useful during backpropagation
    """
    A =1/(1+np.exp(-Z))
    cache = Z
return A, cache

sigmoid_backward函式如下：

def sigmoid_backward(dA, cache):
"""
    Implement the backward propagation for a single SIGMOID unit.
    Arguments:
    dA -- post-activation gradient, of any shape
    cache -- 'Z' where we store for computing backward propagation efficiently
    Returns:
    dZ -- Gradient of the cost with respect to Z
    """
    Z = cache
    s =1/(1+np.exp(-Z))
    dZ = dA * s *(1-s)
assert(dZ.shape == Z.shape)
return dZ

relu函式如下：

def relu(Z):
"""
    Implement the RELU function.
    Arguments:
    Z -- Output of the linear layer, of any shape
    Returns:
    A -- Post-activation parameter, of the same shape as Z
    cache -- a python dictionary containing "A" ; stored for computing the backward pass efficiently
    """
    A = np.maximum(0,Z)
assert(A.shape == Z.shape)
    cache = Z 
return A, cache

relu_backward函式如下：

def relu_backward(dA, cache):
"""
    Implement the backward propagation for a single RELU unit.
    Arguments:
    dA -- post-activation gradient, of any shape
    cache -- 'Z' where we store for computing backward propagation efficiently
    Returns:
    dZ -- Gradient of the cost with respect to Z
    """
    Z = cache
    dZ = np.array(dA, copy=True)# just converting dz to a correct object.
# When z <= 0, you should set dz to 0 as well. 
    dZ[Z <=0]=0
assert(dZ.shape == Z.shape)
return dZ

第二步：任務描述

接下來，我們首先簡單的描述一下我們需要實現的功能。

為了最終建立我們的神經網路模型，我們首先需要實現其中相關的一些方法。

接下來，我們將會去依次實現這些需要的方法。

一個神經網路的計算過程如下:

1. 初始化網路引數

2. 前向傳播

2.1 計算一層的中線性求和的部分

2.2 計算啟用函式的部分（ReLU使用L-1次，Sigmod使用1次）

2.3 結合線性求和與啟用函式

3. 計算誤差

4. 反向傳播

4.1 線性部分的反向傳播公式

4.2 啟用函式部分的反向傳播公式

4.3 結合線性部分與啟用函式的反向傳播公式

5. 更新引數

整個流程圖如下圖所示：

第三步：初始化

接下來，我們需要實現初始化函式

對於一個兩層的神經網路結構而言，模型結構是線性->ReLU->線性->sigmod函式。

初始化函式如下：

def initialize_parameters(n_x, n_h, n_y):
"""
    Argument:
    n_x -- size of the input layer
    n_h -- size of the hidden layer
    n_y -- size of the output layer
    Returns:
    parameters -- python dictionary containing your parameters:
                    W1 -- weight matrix of shape (n_h, n_x)
                    b1 -- bias vector of shape (n_h, 1)
                    W2 -- weight matrix of shape (n_y, n_h)
                    b2 -- bias vector of shape (n_y, 1)
    """
    np.random.seed(1)
### START CODE HERE ### (≈ 4 lines of code)
    W1 = np.random.randn(n_h, n_x)*0.01
    b1 = np.zeros((n_h,1))
    W2 = np.random.randn(n_y, n_h)*0.01
    b2 = np.zeros((n_y,1))
### END CODE HERE ###
assert(W1.shape ==(n_h, n_x))
assert(b1.shape ==(n_h,1))
assert(W2.shape ==(n_y, n_h))
assert(b2.shape ==(n_y,1))
    parameters ={"W1": W1,
"b1": b1,
"W2": W2,
"b2": b2}
return parameters

驗證一下：

parameters = initialize_parameters(3,2,1)
print("W1 = "+ str(parameters["W1"]))
print("b1 = "+ str(parameters["b1"]))
print("W2 = "+ str(parameters["W2"]))
print("b2 = "+ str(parameters["b2"]))

那麼，對於一個L層的神經網路而言呢？初始化是什麼樣的？

假設X的維度為（12288,209）

第l層的W的維度為(layer_dims[l], layer_dims[l-1])。

而第l層的b的維度為(layer_dims[l], 1)。

因此，初始化函式如下：

def initialize_parameters_deep(layer

 
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    深度學習DeepLearning.ai系列課程學習總結：8. 多層神經網路程式碼實戰
      
                

轉載過程中，圖片丟失，程式碼顯示錯亂。

為了更好的學習內容，請訪問原創版本：

http://www.missshi.cn/api/view/blog/59ac0136e519f50d040001a7

Ps：初次訪問由於js檔案較大，請耐心等候（8s左 

  
 

    

    
    深度學習DeepLearning.ai系列課程學習總結：1. 深度學習簡介
      
                

轉載過程中，圖片丟失。
更多資訊請範圍原創版本：



本節內容對應吳恩達deeplearning.ai課程中，第一部分第一週的內容。

學習過程中的一些筆記與心得與大家分享！



Welcome

歡迎大家來到深度學習課堂！

很多人可能已經發現深度學習已經開始影響了 

  
 

    

    
    深度學習DeepLearning.ai系列課程學習總結：課程概述
      
                

如果你想了解前沿的AI技術，那麼本課程一定會讓你受益匪淺。

目前，深度學習工程師受到大量的熱捧，掌握深度學習技術將為您帶來無數新的職業機會。

深度學習有著巨大的魔力，它可以讓您建立在幾年前不可能實現的人工智慧系統。

在本課程中，您將會學習深度學習的基礎。完成本課程後 

  
 

    

    
    吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（1-3）-- 淺層神經網路
      
							
							
							





以下為在Coursera上吳恩達老師的DeepLearning.ai課程專案中，第一部分《神經網路和深度學習》第三週課程“淺層神經網路”部分關鍵點的筆記。筆記並不包含全部小視訊課程的記錄，如需學習筆記中捨棄的內容請至Coursera 或者 網易雲課堂 

  
 

    

    
    deeplearning.ai 第四課第二週 resnet 50層神經網路實現
      
							
							
							1、匯入函式庫:



import numpy as np
from keras import layers
from keras.layers import Input, Add, Dense, Activation, ZeroPadding2D, Batc 

  
 

    

    
    心得丨吳恩達Deeplearning.ai 全部課程學習心得分享
      


選自Medium作者：Ryan Shrott    機器之心編譯


本文作者，加拿大國家銀行首席分析師 Ryan Shrott 完成了迄今為止（2017 年 10 月 25 日）吳恩達在 Coursera 上釋出的所有深度學習課程，併為我們提供了課程解讀。


目前 Coursera 上可用的課程中， 

  
 

    

    
    六天搞懂“深度學習”之三：多層神經網路
       
  
  
 為了克服單層神經網路只能解決線性可分問題的侷限性，神經網路進化為多層結構。然而，花費了將近30年的時間，才將隱藏層新增到單層神經網路中。很難理解為什麼花費了這麼長時間，其中的主要問題是學習規則。 
 單層神經網路中的增量規則對於多層神經網路的訓練是無效的，這是因為訓練中在隱藏層產生的誤差並沒 

  
 

    

    
    深度學習-基於spark的多層神經網路
      
                
最後我們再寫3篇基於spark的深度學習，這篇是手寫識別的，用的是spark的local模式，如果想用叢集模式在submit的時候設定-useSparkLocal false，或者在程式中設定useSparkLocal=false，程式碼如下

public class M 

  
 

    

    
    深度學習實踐（二）——多層神經網路
       
 
  
  
 #一、準備 為了更深入的理解神經網路，筆者基本採用純C++的手寫方式實現，其中矩陣方面的運算則呼叫opencv，資料集則來自公開資料集a1a。 實驗環境： 
  
  Visual studio 2017 
  opencv3.2.0  
  a1a資料集 
  
 本文緊跟上篇文章深度 

  
 

    

    
    跟著吳恩達學深度學習：用Scala實現神經網路-第二課：用Scala實現多層神經網路
      
                
上一章我們講了如何使用Scala實現LogisticRegression，這一張跟隨著吳恩達的腳步我們用Scala實現基礎的深度神經網路。順便再提一下，吳恩達對於深度神經網路的解釋是我如今聽過的最清楚的課，感嘆一句果然越是大牛知識解釋得越清晰明瞭。

本文分為以下四個部分。 

  
 

    

    
    deeplearning.ai 第四課第一週， 卷積神經網路的tensorflow實現
      
							
							
							1、載入需要模組和函式：



import math
import numpy as np
import h5py
import matplotlib.pyplot as plt
import scipy
from PIL import Image
from  

  
 

    

    
    Tensorlayer學習筆記——多層神經網路
      
                
一、簡單粗暴，先看程式碼

import tensorflow as tf
import tensorlayer as tl

sess = tf.InteractiveSession()
# 匯入資料
X_train, y_train, X_val, y_val, X_t 

  
 

    

    
    Halcon實戰之基於MLP多層神經網路的訓練學習
      
                MLP多層感知器其實是一種人工神經網路結構，屬於非引數估計，可以用於解決分類和迴歸問題。如果使用“BP演算法”也稱為BP神經網路，是一種前向結構的人工神經網路，對映一組輸入向量到一組輸出向量。MLP可以被看作是一個有向圖，由多個的節點層所組成，每一層都全連線到下一層。除了輸入 

  
 

    

    
    Python20行程式碼實現多層神經網路的學習
      
                
轉載自：python小練習（062）：python20行程式碼實現多層神經網路的機器學習（一）http://bbs.fishc.com/thread-81849-1-1.html(出處: 魚C論壇)今天在魚C論壇看到一個很好的入門機器學習的小例子，分享給大家。現在神經網路、 

  
 

    

    
    [手把手系列之二]實現多層神經網路
      
							
							
							
  完整程式碼：>>點我 歡迎star,fork,一起學習




網路用途

或者說應用場景：使用單層神經網路來識別一張圖片是否是貓咪的圖片。



數學表示

給定一張圖片XX 送到網路中，判斷這張圖片是否是貓咪的照片？



網路架構

多層 

  
 

    

    
    吳恩達深度學習deeplearning.ai-Week2課後作業-Logistic迴歸與梯度下降向量化
      
                一、deeplearning-assignment

這篇文章會幫助構建一個用來識別貓的邏輯迴歸分類器。通過這個作業能夠知道如何進行神經網路學習方面的工作,指導你如何用神經網路的思維方式做到這些，同樣也會加深你對深度學習的認識。

儘量不要在程式碼中出現for迴圈，可以用nu 

  
 

    

    
    deeplearning.ai第二課第一週：深度學習實用技巧
       
 
  
  
 1 訓練/驗證/測試集 
 機器學習/深度學習中，一般會把資料集分為訓練集(training set)、驗證集(validation set/development set,dev set)、測試集(test set)三部分。 
 訓練集用於對模型進行訓練；驗證集用於對單一指標進行確定， 

  
 

    

    
    deeplearning.ai 構建機器學習項目 Week 1 聽課筆記
      來源   enc   develop   提高   oid   我們   隱藏   n)   機器學習   這門課是講一些分析機器學習問題的方法，如何更快速高效的優化機器學習系統，以及NG自己的工程經驗和教訓。
 
1. 正交化(Othogonalization)
　　設計機器學習系統時需要面對一個問題是：可 

  
 

    

    
    吳恩達深度學習筆記(15-21)總結-淺層神經網路總結
       
  
  
 恩達老師的這一週的淺層神經網路總結，還是簡單的架構說明，但是還是要仔細讀哦！ 
 架構分為四部分： 
 神經網路表示 計算神經網路輸出 啟用函式 神經網路的梯度下降  第一和第二部分： 神經網路表示和計算神經網路輸出部分，由於本部分講的是淺層的網路輸出，所以就是隻有一個隱藏層的神經網路，你也 

  
 

    

    
    吳恩達DeepLearning.ai系列課後程式設計題實踐總結week3
      
							
							
							# -*- coding: utf-8 -*-
"""
Created on Sun Sep 24 09:09:10 2017

@author: Jay
"""

import numpy as np
import matplotlib.pyplot as p