一文入門BP神經網路——從原理到應用（應用篇）

阿新 • • 發佈：2019-02-03

編號	公式	備註
1	Z[l]=w[l]A[l−1]+b[l]
2	A[l]=σ(Z[l])
3	dZ[L]=∇AC⊙σ′(Z[L])
4	dZ[l]=[w[l+1]TdZ[l+1]]⊙σ′(Z[l])
5	db[l]=∂C∂b[l]=1mmeanOfEachRow(dZ[l])
6	dw[l]=∂C∂w[l]=1mdZ[l]A[l−1]T
7	b[l]←b[l]−α⋅db[l]
8	w[l]←w[l]−α⋅dw[l]
9	d A[l]=w[l]T⊙dZ[l]
10	C=−1m∑mi=1(y(i)log(a[L](i))+(1−y(i))log(1−a[L](i)))	代價函式

1. 輔助函式

輔助函式主要包括啟用函式以及啟用函式的反向傳播過程函式：

其中，啟用函式反向傳播程式碼對應公式4和9.

def sigmoid(z):
    """
    使用numpy實現sigmoid函式

    引數：
    Z numpy array
    輸出：
    A 啟用值（維數和Z完全相同）
    """
    return 1/(1 + np.exp(-z))

def 
 relu(z):
    """
    線性修正函式relu

    引數：
    z numpy array
    輸出：
    A 啟用值（維數和Z完全相同）

    """
    return np.array(z>0)*z

def sigmoidBackward(dA, cacheA):
    """
    sigmoid的反向傳播

    引數：
    dA 同層啟用值
    cacheA 同層線性輸出
    輸出：
    dZ 梯度

    """
    s = sigmoid(cacheA)
    diff = s*(1 - s)
    dZ = dA * diff
    return 
 dZ

def reluBackward(dA, cacheA):
    """
    relu的反向傳播

    引數：
    dA 同層啟用值
    cacheA 同層線性輸出
    輸出：
    dZ 梯度

    """
    Z = cacheA
    dZ = np.array(dA, copy=True) 
    dZ[Z <= 0] = 0
    return dZ

另外一個重要的輔助函式是資料讀取函式和引數初始化函式：

def loadData(dataDir):
    """
    匯入資料

    引數：
    dataDir 資料集路徑
    輸出：
    訓練集，測試集以及標籤
    """
    train_dataset = h5py.File(dataDir+'/train.h5', "r")
    train_set_x_orig = np.array(train_dataset["train_set_x"][:]) # your train set features
    train_set_y_orig = np.array(train_dataset["train_set_y"][:]) # your train set labels

    test_dataset = h5py.File(dataDir+'/test.h5', "r")
    test_set_x_orig = np.array(test_dataset["test_set_x"][:]) # your test set features
    test_set_y_orig = np.array(test_dataset["test_set_y"][:]) # your test set labels

    classes = np.array(test_dataset["list_classes"][:]) # the list of classes

    train_set_y_orig = train_set_y_orig.reshape((1, train_set_y_orig.shape[0]))
    test_set_y_orig = test_set_y_orig.reshape((1, test_set_y_orig.shape[0]))

    return train_set_x_orig, train_set_y_orig, test_set_x_orig, test_set_y_orig, classes

def iniPara(laydims):
    """
    隨機初始化網路引數

    引數：
    laydims 一個python list
    輸出：
    parameters 隨機初始化的引數字典（”W1“，”b1“，”W2“，”b2“, ...）
    """
    np.random.seed(1)
    parameters = {}
    for i in range(1, len(laydims)):
        parameters['W'+str(i)] = np.random.randn(laydims[i], laydims[i-1])/ np.sqrt(laydims[i-1])
        parameters['b'+str(i)] = np.zeros((laydims[i], 1))
    return parameters

2. 前向傳播過程

對應公式1和2.

def forwardLinear(W, b, A_prev):
    """
    前向傳播
    """
    Z = np.dot(W, A_prev) + b
    cache = (W, A_prev, b)
    return Z, cache

def forwardLinearActivation(W, b, A_prev, activation):
    """
    帶啟用函式的前向傳播
    """
    Z, cacheL = forwardLinear(W, b, A_prev)
    cacheA = Z
    if activation == 'sigmoid':
        A = sigmoid(Z)
    if activation == 'relu':
        A = relu(Z)
    cache = (cacheL, cacheA)
    return A, cache

def forwardModel(X, parameters):
    """
    完整的前向傳播過程
    """
    layerdim = len(parameters)//2
    caches = []
    A_prev = X
    for i in range(1, layerdim):
        A_prev, cache = forwardLinearActivation(parameters['W'+str(i)], parameters['b'+str(i)], A_prev, 'relu')
        caches.append(cache)

    AL, cache = forwardLinearActivation(parameters['W'+str(layerdim)], parameters['b'+str(layerdim)], A_prev, 'sigmoid')
    caches.append(cache)

    return AL, caches

3. 反向傳播過程

線性部分反向傳播對應公式5和6。

def linearBackward(dZ, cache):
    """
    線性部分的反向傳播

    引數：
    dZ 當前層誤差
    cache （W, A_prev, b）元組
    輸出：
    dA_prev 上一層啟用的梯度
    dW 當前層W的梯度
    db 當前層b的梯度
    """
    W, A_prev, b = cache
    m = A_prev.shape[1]

    dW = 1/m*np.dot(dZ, A_prev.T)
    db = 1/m*np.sum(dZ, axis = 1, keepdims=True)
    dA_prev = np.dot(W.T, dZ)

    return dA_prev, dW, db

非線性部分對應公式3、4、5和6 。

def linearActivationBackward(dA, cache, activation):
    """
    非線性部分的反向傳播

    引數：
    dA 當前層啟用輸出的梯度
    cache （W, A_prev, b）元組
    activation 啟用函式型別
    輸出：
    dA_prev 上一層啟用的梯度
    dW 當前層W的梯度
    db 當前層b的梯度
    """
    cacheL, cacheA = cache

    if activation == 'relu':
        dZ = reluBackward(dA, cacheA)
        dA_prev, dW, db = linearBackward(dZ, cacheL)
    elif activation == 'sigmoid':
        dZ = sigmoidBackward(dA, cacheA)
        dA_prev, dW, db = linearBackward(dZ, cacheL)

    return dA_prev, dW, db

完整反向傳播模型：

def backwardModel(AL, Y, caches):
    """
    完整的反向傳播過程

    引數：
    AL 輸出層結果
    Y 標籤值
    caches 【cacheL, cacheA】
    輸出：
    diffs 梯度字典
    """
    layerdim = len(caches)
    Y = Y.reshape(AL.shape)
    L = layerdim

    diffs = {}

    dAL = - (np.divide(Y, AL) - np.divide(1 - Y, 1 - AL))

    currentCache = caches[L-1]
    dA_prev, dW, db =  linearActivationBackward(dAL, currentCache, 'sigmoid')
    diffs['dA' + str(L)], diffs['dW'+str(L)], diffs['db'+str(L)] = dA_prev, dW, db

    for l in reversed(range(L-1)):
        currentCache = caches[l]
        dA_prev, dW, db =  linearActivationBackward(dA_prev, currentCache, 'relu')
        diffs['dA' + str(l+1)], diffs['dW'+str(l+1)], diffs['db'+str(l+1)] = dA_prev, dW, db

    return diffs

4. 測試結果

開啟你的jupyter notebook，執行我們的BP.ipynb檔案，首先匯入依賴庫和資料集，然後使用一個迴圈來確定最佳的迭代次數大約為2000：

【圖6】

最後用一個例子來看一下模型的效果——判斷一張圖片是不是貓：

【圖7】

好了，測試到此結束。你也可以自己嘗試其它的神經網路結構和測試其它圖片。

一文入門BP神經網路——從原理到應用（應用篇）

編號公式備註 1 Z[l]=w[l]A[l−1]+b[l] 2 A[l]=σ(Z[l]) 3 dZ[L]=∇AC⊙σ′(Z[L]) 4 dZ[l]=[w[l+1]

一文看懂神經網路工作原理

現在談人工智慧已經繞不開“神經網路”這個詞了。人造神經網路粗線條地模擬人腦，使得計算機能夠從資料中學習。機器學習這一強大的分支結束了 AI 的寒冬，迎來了人工智慧的新時代。簡而言之，神經網路可能是今天最具有根本顛覆性的技術。看完這篇神經網路的指南，你也可以和別

BP神經網路演算法原理推導（數學建模進階演算法/機器學習）

BP神經網路（Back-Propagation Network）演算法原理推導簡介反向傳播網路（Back-Propagation Network）簡稱BP網路,基於誤差反向傳播演算法（BP演算法）的一種多層網路。

BP神經網路迴歸預測模型（python實現）

神經網路模型一般用來做分類，迴歸預測模型不常見，本文基於一個用來分類的BP神經網路，對它進行修改，實現了一個迴歸模型，用來做室內定位。模型主要變化是去掉了第三層的非線性轉換，或者說把非線性啟用函式Sigmoid換成f(x)=x函式。這樣做的主要原因是Sigmoi

卷積神經網路改進想法初探（上篇）

最近一直在看卷積神經網路，想改進改進弄出點新東西來，看了好多論文，寫了一篇綜述，對深度學習中卷積神經網路有了一些新認識，和大家分享下。其實卷積神經網路並不是一項新興的演算法，早在上世紀八十年代就已經被提出來，但當時硬體運算能力有限，所以當時只用來識別支票上的

一文弄懂神經網路中的反向傳播法——BackPropagation [Mechine Learning & Algorithm] 神經網路基礎 [Mechine Learning & Algorithm] 神經網路基礎

原文地址：https://www.cnblogs.com/charlotte77/p/5629865.html 最近在看深度學習的東西，一開始看的吳恩達的UFLDL教程，有中文版就直接看了，後來發現有些地方總是不是很明確，又去看英文版，然後又找了些資料看，才發現，中文版的譯者在翻譯的時候會對省略的公式推導過

一文弄懂神經網路中的反向傳播法——BackPropagation

　　最近在看深度學習的東西，一開始看的吳恩達的UFLDL教程，有中文版就直接看了，後來發現有些地方總是不是很明確，又去看英文版，然後又找了些資料看，才發現，中文版的譯者在翻譯的時候會對省略的公式推導過程進行補充，但是補充的又是錯的，難怪覺得有問題。反向傳播法其實是神經網路

一文讀懂神經網路(附PPT、視訊)

來源：雲棲社群本文共6500字，建議閱讀10分鐘。本文從神經網路的發展歷史出發，為你介紹感知器模

BP 神經網路演算法原理

本篇文章主要根據《神經網路與機器學習》和《人工神經網路原理》兩本書，對 BP 神經網路的數學推導過程做了一個總結，為自己進入深度學習打下一個基礎。一、人工神經網路 1.人工神經網路簡介人工神經網路（ANN）是一種旨在模仿人腦結構及其功能的由多

BP神經網路實現分類問題（python）

一些程式碼解釋 python版本：3.6 梯度更新下面的程式碼是對輸出層和隱層的梯度計算，具體可參考周志華機器學習103頁梯度更新公式 for i in range(self.outputn):#計算輸出層的梯度 y=

MATLAB BP神經網路用法的總結（試用於初學者）

BP（back propagation，反向傳播）神經網路功能及其MATLAB實現。反向傳播指誤差函式會由輸出端向前反向傳播，隱含層藉此調整權值來縮小誤差。結構圖： W為權值，b為閾值。 1. 資料輸入：資料輸入時需先使用傳遞函式進行變化，變換方法包括閾值

神經網路模型學習筆記（ANN,BPNN）

人工神經網路（Artificial Neural Network，即ANN ），是20世紀80 年代以來人工智慧領域興起的研究熱點。它也是目前各種神經網路模型的基礎。本文主要對BPNN模型進行學習。什麼是神經網路？神經網路是一種運算模型，由

神經網路例程-使用（3-1）結構的神經網路實現與、或、異或三種邏輯運算

以下程式碼來自Deep Learning for Computer Vision with Python第十章。本例程需要在同一檔案內新建四個檔案。分別是1、perceptron.py；2、perceptron_or.py；3、perceptron_and.py；4、pe

這一次，真正搞懂信用評分模型（上篇）

工程師集中重要 sklearn app 目的概率單變量是我 python風控評分卡建模和風控常識 https://study.163.com/course/introduction.htm?courseId=1005214003&utm_campaign

分享打造爆款書的方法，同時聊聊出版圖書中的哪些事和哪些坑通過出版一本案例方面的圖書來包裝自己（實施篇）

想想若干年前，我通過一位非常熱情的圖書公司的編輯，出版了我的第一本計算機圖書，從此後一發不可收拾，最近2年出版了2本，有1本已經完稿，還有兩本尚在寫作途中。確實，出版出一件名利雙收的事，我認識的一位朋友出版了《HTTP抓包實戰》，月均銷售1200+，而且還出了繁體版的，目前靠這個也

入門RabbitMQ訊息佇列結合SSH框架（配置篇）

使用RabbitMQ訊息佇列，因為訊息佇列的非同步思想，解耦，以及允許短暫的不一致性，就像我現在把東西放在桌子上，你可以去拿，別人也可以去拿，而我不用等人拿完我便放東西上去，這樣就保證了我（生產者）和接收者沒有什麼聯絡，而且接受者可以隨時去拿。我們要使用RabbitMQ，安裝

MMO遊戲伺服器從零開發（架構篇）

MMO遊戲伺服器屬於大型多人線上遊戲伺服器，負載，穩定，效率（包括反饋延遲和開發效率）是這種伺服器基本要求。本人從10年入行至今一直從事MMO遊戲的研發和架構設計工作，對此類伺服器有一些理解和見解。下面分享給想了解遊戲伺服器開發的朋友們。這些是本人這些年來對MMO伺服器架

Python3網路裝置巡檢（交換機篇）

介紹只寫了交換機的，路由器、防火牆、負載等其它裝置以後，有需求再寫，下面以一組交換機為例。思路 1、收取交換機的資訊需要哪些資訊，哪些命令，不同品牌交換機命令不同（本篇以H3C為例），需要提前規劃好。交換機的IP、名字、密碼等資訊，寫

一次 RocketMQ 程序自動退出排查經驗分享（實戰篇）

1、背景公司一個 RocketMQ 叢集由4主4從組成，突然其中3臺伺服器“竟然”在同一時間下線，其監控顯示如下：依次檢視三臺機器的監控圖形，時間戳幾乎完美“吻合”，不可思議吧。 2、故障分析出現問題，先二話不說，馬上重啟各伺服器，儘快恢復叢集，降低對業務的影響，接下來開始對日誌進行分析。 Java

深度 | 生成對抗網路初學入門：一文讀懂GAN的基本原理（附資源）

選自 Sigmoidal 作者：Roman Trusov 機器之心編譯參與：Panda 生成對抗網路是現在人工智慧領域的當紅技術之一。近日，Sigmoidal.io 的部落格發表了一篇入門級介紹文章，對 GAN 的原理進行了解釋說明。另外，在該文章的最後還附帶了一些能幫助初學者自己

一文入門BP神經網路——從原理到應用（應用篇）

1. 輔助函式

2. 前向傳播過程

3. 反向傳播過程

4. 測試結果

相關推薦