矩陣標準差在神經網路中的反向傳播以及數值微分梯度驗證

阿新 • • 發佈：2019-01-08

最近開腦洞想訓練一個關於球面擬合的模型於是用到了標準差作為輸出層的損失函式，所以就對於標準差方程進行反向傳播推導了一下。

現在分享一下推導過程和結果和用數值微分方法對於結果正確性的驗證，順便記錄一下以免忘記了。

這是標準差方程

標準差主要是用來描述資料離散程度，其實就是方差的開平方

首先若a為矩陣，那麼標準差計算可用numpy實現如下

np.sqrt(np.sum((a - np.mean(a)) ** 2) / a.size);

矩陣標準差數值微分求梯度如下，（這個函式主要用來驗證反向傳播推導結果）

# 數值微分求標準差梯度
def gradient ():
    d  
= 1e-5;
    grad = np.zeros(a.size);
    func = lambda : np.sqrt(np.sum((a - np.mean(a)) ** 2) / a.size);
    # func = lambda : np.std(a, ddof = 1);
    # func = lambda : np.mean(a);
    for index, value in enumerate(a):
        bak = value;
        a[index] -= d;
        leftv = func();
        a[index]  
= bak;
        a[index] += d;
        rightv = func();
        a[index] = bak;
        grad[index] = (rightv - leftv) / (d * 2);
    return grad;

接下來是標準差方程的反向傳播推導過程，直接上草稿紙

這裡初步推匯出結果

所以，反向傳播求標準差方程的Python實現程式碼如下

這裡傳入索引可計算矩陣中每一個元素相對於標準差方程的導數，這裡沒用numpy陣列作為引數，可自己修改程式碼支援矩陣，我就不附上了

def func2 (index):
     
# x
    x = a[index];
    # 平均數
    avg = np.mean(a);
    # 平方和
    sqsum = np.sum((a - avg) ** 2);
    # N
    n = a.size;
    print((np.power(sqsum / n, -0.5) * (x - avg)) / n);

看一下結果

上面是數值微分的結果，下面是反向傳播的結果，基本一致，可以證明反向傳播推導正確

附上全部程式碼

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

import numpy as np;

a = np.array([3.0, 3.0, 2.0, 4.9, 100.2, -8.9]);

# 數值微分求標準差梯度
def gradient ():
    d = 1e-5;
    grad = np.zeros(a.size);
    func = lambda : np.sqrt(np.sum((a - np.mean(a)) ** 2) / a.size);
    # func = lambda : np.std(a, ddof = 1);
    # func = lambda : np.mean(a);
    for index, value in enumerate(a):
        bak = value;
        a[index] -= d;
        leftv = func();
        a[index] = bak;
        a[index] += d;
        rightv = func();
        a[index] = bak;
        grad[index] = (rightv - leftv) / (d * 2);
    return grad;

grad = gradient();

def func2 (index):
    # x
    x = a[index];
    # 平均數
    avg = np.mean(a);
    # 平方和
    sqsum = np.sum((a - avg) ** 2);
    # N
    n = a.size;
    return (np.power(sqsum / n, -0.5) * (x - avg)) / n;

print(grad);
n1 = func2(0);
n2 = func2(1);
n3 = func2(2);
n4 = func2(3);
n5 = func2(4);
n6 = func2(5);
b = [n1, n2, n3, n4, n5, n6];
print(b);

矩陣標準差在神經網路中的反向傳播以及數值微分梯度驗證

最近開腦洞想訓練一個關於球面擬合的模型於是用到了標準差作為輸出層的損失函式，所以就對於標準差方程進行反向傳播推導了一下。現在分享一下推導過程和結果和用數值微分方法對於結果正確性的驗證，順便記錄一下以免忘記了。這是標準差方程標準差主要是用來描述資料離散程度，其實就是方差的開平方

神經網路中反向傳播演算法（BP）

神經網路中反向傳播演算法（BP）本文只是對BP演算法中的一些內容進行一些解釋，所以並不是嚴格的推導，因為我在推導的過程中遇見很多東西，當時不知道為什麼要這樣，所以本文只是對BP演算法中一些東西做點自己的合理性解釋，也便於自己理解。要想看懂本文，要懂什麼是神經網路，對前向傳播以

神經網路中反向傳播演算法(backpropagation)的pytorch實現，pytorch教程中的程式碼解讀以及其他一些疑問與解答

pytorch的官網上有一段教程，是使用python的numpy工具實現一個簡單的神經網路的bp演算法。下面先貼上自己的程式碼： import numpy as np N,D_in,H,D_out = 4,10,8,5 x = np.random.randn(N,D_i

AI應用開發基礎傻瓜書系列2-神經網路中反向傳播與梯度下降的基本概念

第二篇：神經網路中反向傳播與梯度下降的基本概念預警：本篇部落格中會涉及到偏導數的概念，但是非常初級，很容易理解，建議硬著頭皮看，跟著算一遍，看完之後保證會覺得人生美好了很多。反向傳播和梯度下降這兩個詞，第一眼看上去似懂非懂，不明覺厲。這兩個概念是整個神經網路中的重要組成部分，是和誤差函式/損失函式的概念

神經網路的反向傳播演算法中矩陣的求導方法(矩陣求導總結)

前言神經網路的精髓就是反向傳播演算法,其中涉及到一些矩陣的求導運算,只有掌握了與矩陣相關的求導法則才能真正理解神經網路. 與矩陣有關的求導主要分為兩類: 標量 f 對矩陣 W的導數 (其結果是和W同緯度的矩陣,也就是f對W逐元素求導排成與W尺寸相同的矩陣

吳恩達機器學習（第十章）---神經網路的反向傳播演算法

一、簡介我們在執行梯度下降的時候，需要求得J(θ)的導數，反向傳播演算法就是求該導數的方法。正向傳播，是從輸入層從左向右傳播至輸出層；反向傳播就是從輸出層，算出誤差從右向左逐層計算誤差，注意：第一層不計算，因為第一層是輸入層，沒有誤差。二、如何計算設為第l層，第j個的誤差。

吳恩達機器學習 - 神經網路的反向傳播演算法吳恩達機器學習 - 神經網路的反向傳播演算法

原吳恩達機器學習 - 神經網路的反向傳播演算法 2018年06月21日 20:59:35 離殤灬孤狼閱讀數：373

（轉載）深度學習基礎（3）——神經網路和反向傳播演算法

原文地址：https://www.zybuluo.com/hanbingtao/note/476663 轉載在此的目的是自己做個筆記，日後好複習，如侵權請聯絡我！！　　在上一篇文章中，我們已經掌握了機器學習的基本套路，對模型、目標函式、優化演算法這些概念有了一定程度的理解，而且已經會訓練單個的感知器或者

通俗理解神經網路BP反向傳播演算法

轉載自通俗理解神經網路BP反向傳播演算法通俗理解神經網路BP反向傳播演算法在學習深度學習相關知識，無疑都是從神經網路開始入手，在神經網路對引數的學習演算法bp演算法，接觸了很多次，每一次查詢資料學習，都有著似懂非懂的感覺，這次趁著思路比較清楚，也為了能夠讓一些像

全連線神經網路的反向傳播演算法（BP）

一、預熱篇參考連結：http://colah.github.io/posts/2015-08-Backprop/ 要理解的主要點：路徑上所有邊相乘，所有路徑相加反向傳播演算法(Backpropagation)已經是神經網路模型進行學習的標配。但是有很多問題值得思考一下：反向傳播

神經網路的反向傳播公式的推導

神經網路的反向傳播公式的推導前言：早該開始入坑CNN,RNN的博主總覺得要先能用python加numpy手擼一個神經網路，才能更好理解其他神經網路的原理（強迫症）。於是…這一拖就是快兩月（懶），最近填坑的時候才發現以為自己很通透的反向傳播過程，寫起程式碼推起來就…。光看西瓜

深層神經網路和卷積神經網路的反向傳播過程推導

反向傳播過程是深度學習的核心所在，雖然現在很多深度學習架構如Tensorflow等，已經自帶反向傳播過程的功能。我們只需要完成網路結構的正向傳播的搭建，反向傳播過程以及引數更新都是由架構本身來完成的。但為了更好的瞭解深度學習的機理，理解反向傳播過程的原理還是很重要的。在學

神經網路及反向傳播(bp)演算法詳解

神經元和感知器的本質一樣神經元和感知器本質上是一樣的，只不過感知器的時候，它的啟用函式是階躍函式；而當我們說神經元時，啟用函式往往選擇為sigmoid函式或tanh函式。如下圖所示：輸入節點每一個輸入節點對應一個權值，輸入節點可以是任意數。

神經網路和反向傳播演算法推導

注：由於自己畫圖實在太難畫，本文中基本所有插圖來源於演算法糰子機器學習班，請勿轉載 1.普通的機器學習模型：其實，基本上所有的基本機器學習模型都可以概括為以下的特徵：根據某個函式，將輸入計算並輸出。圖形化表示為下圖：當我們的g(h)為sigmoid函式時候，它就是一個

深度神經網路之反向傳播演算法

1.DNN反向傳播演算法簡介回顧我們前面學到的監督問題，通常會遇到這種情況，假如有mmm個訓練樣本，分別為{(x1,y1),(x2,y2),(x3,y3),...,(xm,ym)}\{(x_1,y_1),(x_2,y_2),(x_3,y_3),...,(x_m

大白話5分鐘帶你走進人工智慧-第37節神經網路之反向傳播詳細案例及解釋(5)

目錄 1、反向傳播前述： 2、第一個案例解說反向傳播： 3、通用案例形式： 4、邏輯迴歸案例： 5、總結： 1、反向傳播前述：我們知道正向傳播就是把x拿下來一層層的和w乘，然後經過function非線性變化，最後得到一個y輸出結果。反向傳播(reverse-mode autodiff)就是

關於 RNN 迴圈神經網路的反向傳播求導

# 關於 RNN 迴圈神經網路的反向傳播求導本文是對 RNN 迴圈神經網路中的每一個神經元進行反向傳播求導的數學推導過程，下面還使用 `PyTorch` 對導數公式進行程式設計求證。 ## RNN 神經網路架構一個普通的 RNN 神經網路如下圖所示： ![圖片1](https://tvax1.si

一文弄懂神經網路中的反向傳播法——BackPropagation [Mechine Learning & Algorithm] 神經網路基礎 [Mechine Learning & Algorithm] 神經網路基礎

原文地址：https://www.cnblogs.com/charlotte77/p/5629865.html 最近在看深度學習的東西，一開始看的吳恩達的UFLDL教程，有中文版就直接看了，後來發現有些地方總是不是很明確，又去看英文版，然後又找了些資料看，才發現，中文版的譯者在翻譯的時候會對省略的公式推導過

一文弄懂神經網路中的反向傳播法——BackPropagation

　　最近在看深度學習的東西，一開始看的吳恩達的UFLDL教程，有中文版就直接看了，後來發現有些地方總是不是很明確，又去看英文版，然後又找了些資料看，才發現，中文版的譯者在翻譯的時候會對省略的公式推導過程進行補充，但是補充的又是錯的，難怪覺得有問題。反向傳播法其實是神經網路

神經網路中矩陣求導術的應用

序本文假設讀者熟悉一元微積分，線性代數，並已經學習過矩陣求導術：知乎專欄. 在神經網路中，矩陣求導術發揮的最重要的作用便是求losslossloss對某個引數的梯度. 比如在多層神經網路(MLP)中，某一層的推導公式為al+1=g(Wal+b)a^{l+1}

矩陣標準差在神經網路中的反向傳播以及數值微分梯度驗證

相關推薦