Python實現神經網路Part 1: 實現forward和BP演算法的神經元

阿新 • • 發佈：2019-02-02

主旨和本系列目錄

《Python實現神經網路》是一個文章系列，目的在於：通過實際編寫程式，加深對神經網路所涉及的各類演算法的理解。動機描述詳見“本系列動機”部分。

截止目前本系列已完成部分目錄如下

本系列動機

在學習深度學習理論過程中，由神經元（節點）組成的多層全連線神經網路是最基礎的概念，如下圖所示[1]。
這裡寫圖片描述

這樣一個神經網路要發揮作用，必須有演算法支援，這其中包括前向(forward)結果計算，也包括誤差反向傳播(Backward Propagation, BP)，還有基於梯度的引數訓練等。

在我自己在學習和應用這些演算法的過程中，面臨這樣一種狀況：一方面，理論教材（例如周志華教授的

西瓜書以及網路上浩如煙海的資料）從單個神經元開始詳細講解了上述演算法的數學原理；另一方面，在目前流行的深度學習框架，例如TensorFlow中，這些功能已經被良好封裝，只要呼叫正確的API就可以實現。這樣，學到的數學原理在框架呼叫中並不能直觀的感覺到，雖然已經能用神經網路解決一些問題，但是對於演算法基礎原理的理解仍然不夠深入。

源於此，我開始嘗試用程式碼實現神經網路，希望通過這樣的方式加深對神經網路原理性的理解，在今後的工作中更清楚框架(例如TensorFlow)中API的特性與侷限。

原始碼位置

神經元的軟體設計

在設計中，存在以下假設

神經元與前一級iDims個節點有連線，iDims >=0且iDims為整數

神經元的輸入為1*iDims的向量，記為x

從軟體的角度，神經元可以抽象為一個物件，此物件包含以下成員

權重向量weight→： shape =1*iDims，用於儲存與前一級iDims個連線中每個連線的權重
偏置量bias：這是一個標量，用於記錄偏置值
輸入向量x⃗
啟用函式的輸入值dotValue：dotValue=x⃗ ⊙weight→+bias=∑i=1iDimsweighti∗xi+bias之所以要儲存這個成員，是為了在誤差反向傳播時避免重複計算

程式碼實現

建構函式：在構造時要指定與前一級的連線數目inputDim，同時weight的所有元素和bias均初始化為1

  def __init__(self, inputDim):
    #當前結點與前一級的連線數目
    self.iDims = inputDim
    #權重向量，Shape = (iDims, )
    self.weight = np.random.rand(self.iDims)
    #self.weight = np.ones(self.iDims)
    #偏置 
    self.bias = 1
    #啟用函式的輸入
    self.z = 1
    #當前層的殘差
    self.delta = 1
    #前級節點的輸入向量，必須與iDims匹配，Shape = (iDims, )的向量
    self.x = []

前向計算和儲存計算結果

  #forward: 輸入1*iDims向量，計算前向結果
  def forward(self, ix):
    if (ix.shape <> (self.iDims,)):
      print ("Wrong input shape: x.shape = " + str(ix.shape))
      return
    self.x = ix
    self.dotValue = np.dot(self.x,self.weight) + self.bias
    return sigmoid(self.dotValue)

反向梯度計算：這裡的演算法學習自文獻[2]

  #backward: 輸入前一級計算出的梯度，輸出為兩個陣列
  #第一個陣列: dx，iDims*1向量，即當前節點對於前一級每個輸入的梯度
  #第二個陣列：dw，iDims*1向量，當前節點對於每個權重的梯度
  #第三個陣列：dbias, 1*1向量，當前節點對於偏置量的梯度
  def backward(self, gradient):
    ddot =  (1-self.dotValue) * self.dotValue #Sigmoid函式的求導
    dx = self.weight*ddot*gradient # 回傳到x
    dw = self.x*ddot*gradient # 回傳到w
    dbias = ddot*gradient # 回傳到bias
    return [dx, dw, dbias]

權值調整（訓練）：需要給定學習率LearnRate

  #根據學習率和梯度調整weight和bias引數
  def adjustWeightAndBias(self, learnRate, dw, dbias):
    self.weight = self.weight - learnRate*dw
    self.bias = self.bias - learnRate*dbias

單元測試設計與實現

單元測試例設計為：
前級輸入向量維度iDims = 2，輸入向量x⃗ =(2,2)，目標輸出值為target=11+e
損失函式定義為

loss=(predictValue−target)2

測試程式碼如下

  n1 = NeuralNode(2)
  n1.printParam();

  x = np.ones(2)
  x[0] = 2
  x[1] = 2

  target = 1/(1+np.exp(1))

  for i in range(10000):
    print "Round",i
    fowardResult = n1.forward(x)
    print "Forward Result:",fowardResult
    loss = (fowardResult-target)*(fowardResult-target)
    print "Loss=",loss
    dLossdvalue = 2*(target-fowardResult)
    grad = n1.backward(dLossdvalue)
    print "grad=",grad
    n1.adjustWeightAndBias(0.0001, grad[1], grad[2])
    n1.printParam()
    print ""

測試結果：

目前的神經元實現可以調整權重，使得損失函式向loss降低的方向調整
在足夠多次迭代後，引數總是收斂到如下結果。在這個位置，梯度已經接近於0，無法進一步調整。但我們明確的知道這個位置不是最優解

Round 999
Forward Result: 0.73105857863
Loss= 0.213552267034
grad= [array([ 2.28023604e-17, 2.28023604e-17]), array([ 4.10442486e-16, 4.10442486e-16]), 2.0522124322575492e-16]
Weight = [ 0.11111111 0.11111111]
Bias = 0.555555555556

待解決的問題

單元測試中發現的沒有訓練到最優解的問題：這有兩種可能，一種是隻有一條訓練資料，訓練樣本數量不足；另一種，根據梯度下降調整引數的演算法只實現了最基本的功能，當搜尋到區域性極值點之後由於梯度消失無法跳出來找到更好的極值點。
還沒有實現由多層神經元組成的網路
軟體方面：還沒有實現batch訓練和調整。在TensorFlow中，一次訓練的是一個batch的資料，即輸入X={x⃗ i,i=1,2,...N}，批量計算結果、梯度並調整權值。目前的程式碼只能一次處理一個輸入向量。

參考文獻

Python實現神經網路Part 1: 實現forward和BP演算法的神經元

主旨和本系列目錄《Python實現神經網路》是一個文章系列，目的在於：通過實際編寫程式，加深對神經網路所涉及的各類演算法的理解。動機描述詳見“本系列動機”部分。截止目前本系列已完成部分目錄如下本系列動機在學習深度學習理論過程中，由神經元（

# [cs231n （六）神經網路 part 2:傳入資料和損失 ][1]

標籤（空格分隔）：神經網路 0.回顧 cs231n （一）影象分類識別講了KNN cs231n （二）講了線性分類器：SVM和SoftMax cs231n （三）優化問題及方法 cs231n （四）反向傳播 cs231n （五）神經網路（part 1）

第二次作業：卷積神經網路 part 1

# 第二次作業：卷積神經網路 part 1 ## 視訊學習 ### 數學基礎受結構限制嚴重，生成式模型效果往往不如判別式模型。 RBM：數學上很漂亮，且有統計物理學支撐，但主流深度學習平臺不支援RBM和預訓練。自編碼器：正則自編碼器、稀疏自編碼器、去噪自編碼器和變分自編碼器。 - 概率/函式形

吳恩達的機器學習程式設計作業11：nnCostFunction 求解神經網路的代價函式（含BP演算法）

function [J grad] = nnCostFunction(nn_params, ... input_layer_size, ...

Python中從頭開始實現神經網路 - 介紹

原文出處： http://www.wildml.com/2015/09/implementing-a-neural-network-from-scratch/ Posted on September 3, 2015 by Denny Britz 這篇文章幫助我們用python實踐一下從

python的神經網路實現之BP神經網路

在這裡插入程式碼片# -*- coding: utf-8 -*- """ Created on Sun Oct 14 10:41:33 2018 @author: fang """ # -*- coding:utf-8 -*- #! python2 impo

WIDML翻譯：用Python從頭開始實現神經網路 - 簡介

Get the code: To follow along, all the code is also available as an iPython notebook on Github. 在這篇文章中，我們將從頭開始實現一個簡單的3層神經網路。我們不會得到所需的所有數學，但

python線上神經網路實現手寫字元識別系統

神經網路實現手寫字元識別系統一、課程介紹1. 課程來源課程內容在原文件基礎上做了稍許修改，增加了部分原理介紹，步驟的拆解分析及原始碼註釋。2. 內容簡介本課程最終將基於BP神經網路實現一個手寫字元識別系統，系統會在伺服器啟動時自動讀入訓練好的神經網路檔案，如果檔案不存在，則讀入

CS231n作業筆記2.1：兩層全連線神經網路的分層實現

CS231n簡介作業筆記 1. 神經網路的分層實現全連線前向傳播：out = x.reshape([x.shape[0],-1]).dot(w)+b 全連線後向傳播： x, w, b = cache dx, dw, db = No

【Tensorflow】Python實現神經網路迴歸

環境 macOS，python3.6，tensorflow1.1.0 迴歸問題年份事故起數死亡人數受傷人數直接財產損失（萬元） 2003 80

識別MNIST資料集之（二）：用Python實現神經網路

在這篇文章當中，我們將會用根據MNIST的資料集，跟大家介紹神經網路進行分類的基本原理和方法。 1.神經網路的正向計算如果我們把神經網路當作一個黑盒來看，它的結構大概是這樣的：輸入（層）：一張圖片計算過程：神經網路輸出（層）：這張圖

python 實現神經網路處理資料集cifar10

python 實現單隱層神經網路,處理cifar10資料集 forward_neural_network.py #!/usr/bin/python # -*- coding: utf-8 -*- ##################################### # Fi

用python的numpy實現神經網路實現手寫數字識別

首先是讀取檔案，train-images-idx3-ubyte等四個檔案是mnist資料集裡的資料。放在MNIST資料夾裡。MNIST資料夾和這個.py檔案放在同一個資料夾裡。 import numpy as np import struct train_images

python基於神經網路實現人臉識別

一.專案簡介 1.資料需要資料QQ聯絡：1209028652 資料集：總共資料集由兩部分組成：他人臉圖片集及我自己的部分圖片自己圖片目錄：face_recog/my_faces 他人圖片目錄：face_recog/other_faces 我的測試圖片目錄：face_r

[DeeplearningAI筆記]卷積神經網路3.1-3.5目標定位/特徵點檢測/目標檢測/滑動視窗的卷積神經網路實現/YOLO演算法

4.3目標檢測覺得有用的話,歡迎一起討論相互學習~Follow Me 3.1目標定位物件定位localization和目標檢測detection 判斷影象中的物件是不是汽車–I

pytorch實現神經網路

import torch import torch.nn as nn import torch.nn.functional as F import inspect import torch.optim as optim ''' 自動求導機制：對一個標量用backward() 會反向計算在計算圖中

tensorflow實現神經網路

tensorflow實現神經網路 1、全部步驟實現前向傳播宣告學習率引數進行正則化計算計算損失函式反向傳播引數進行滑動平均 2、各個步驟解釋前向傳播：主要是定義這個網路的結構，網路是幾層的，以及每層使用的啟用函式是

自己動手實現神經網路分詞模型

本文由**羅周楊[email protected]**原創，轉載請註明原作者和出處。原文連結：luozhouyang.github.io/deepseg 分詞作為NLP的基礎工作之一，對模型的效果有直接的影響。一個效果好的分詞，可以讓模型的效能更好。在嘗試使用神經網路來分詞之前，

利用Python進行socket網路程式設計，實現樹莓派與Ubuntu（16.04）之間的簡單的網路聊天

標題目標：採用socket程式設計，完成兩個樹莓派之間、或者樹莓派與Ubuntu系統之間的網路文字通訊（或聊天）分析：首先我們需要了解socket程式設計的原理以及它是怎麼實現的。 Socket的英文原義是“孔”或“插座”。作為BSD UNIX的程序通訊機制，取後一種意思。

# [cs231n （七）神經網路 part 3 : 學習和評估 ][1]

標籤（空格分隔）：神經網路 0.回顧 cs231n （一）影象分類識別講了KNN cs231n （二）講了線性分類器：SVM和SoftMax cs231n （三）優化問題及方法 cs231n （四）反向傳播 cs231n （五）神經網路 part 1:

Python實現神經網路Part 1: 實現forward和BP演算法的神經元

主旨和本系列目錄

本系列動機

原始碼位置

神經元的軟體設計

程式碼實現

單元測試設計與實現

待解決的問題

參考文獻

相關推薦