深度學習筆記——卷積神經網路

阿新 • • 發佈：2018-11-07

程式碼參考了零基礎入門深度學習(4) - 卷積神經網路這篇文章，我只對程式碼裡可能存在的一些小錯誤進行了更改。至於卷積神經網路的原理以及程式碼裡不清楚的地方可以結合該文章理解，十分淺顯易懂。

import numpy as np
from functools import reduce

from DL.cnn import ReluActivator,IdentityActivator,element_wise_op

class RecurrentLayer():
    def __init__(self,input_width,state_width,activator,learning_rate):
        self.input_width = input_width
        self.state_width = state_width
        self.activator = activator
        self.learning_rate = learning_rate
        self.times = 0  # 當前時刻初始化為0
        self.state_list = []    # 儲存各個時刻的state
        self.state_list.append(np.zeros(state_width,1)) # 初始化s0
        self.U = np.random.uniform(-1e-4,1e-4,(state_width,input_width))    #初始化U
        self.W = np.random.uniform(-1e-4,1e-4,(state_width,state_width))    #初始化W

    def forward(self,input_array):
        '''
        根據式2進行前向計算
        '''
        self.times += 1
        state = (np.dot(self.U,input_array)+np.dot(self.W,self.state_list[-1]))
        element_wise_op(state,self.activator.forward)
        self.state_list.append(state)

    def backward(self,sensitivity_array,activator):
        '''
        實現BPTT演算法
        '''
        self.calc_delta(sensitivity_array,activator)
        self.calc_gradient()

    def calc_delta(self, sensitivity_array, activator):
        # 用來儲存各個時刻的誤差項
        self.delta_list = []
        for i in range(self.times):
            self.delta_list.append(np.zeros(self.state_width,1))
        self.delta_list.append(sensitivity_array)
        # 迭代計算每個時刻的誤差項
        for k in range(self.times-1,0,-1):
            self.calc_delta_k(k,activator)

    def calc_delta_k(self, k, activator):
        '''
        根據t+1時刻的delta計算k時刻的delta
        f’(neti)怎麼成了f(neti)
        '''
        state = self.state_list[k+1].copy()
        element_wise_op(self.state_list[k+1],activator.backward)
        self.delta_list[k] = np.dot(np.dot(self.delta_list[k+1].T,self.W),np.diag(state[:,0])).T

    def calc_gradient(self):
        # 儲存各個時刻的權重梯度
        self.gradient_list = []
        for t in range(self.times+1):
            self.gradient_list.append(np.zeros((self.state_width,self.state_width)))
        for t in range(self.times,0,-1):
            self.calc_gradient_t(t)
        # 實際的梯度是各個時刻的梯度之和
        # [0]被初始化為0且沒有被修改過
        self.gradient = reduce(lambda a,b:a+b,self.gradient_list,self.gradient_list[0])

    def calc_gradient_t(self, t):
        '''
        計算每個時刻t權重的梯度
        '''
        gradient = np.dot(self.delta_list[t],self.state_list[t-1].T)
        self.gradient_list[t] = gradient

    def update(self):
        '''
        按照梯度下降，更新權重
        '''
        self.W -= self.learning_rate*self.gradient

    # 上面的程式碼不包含權重U的更新。這部分實際上和全連線神經網路是一樣的.

    # 迴圈層是一個帶狀態的層，每次forword都會改變迴圈層的內部狀態，這給梯度檢查帶來了麻煩。
    # 因此，我們需要一個reset_state方法，來重置迴圈層的內部狀態。
    def reset_state(self):
        self.times = 0
        self.state_list = []
        self.state_list.append((np.zeros((self.state_width,1))))


def data_set():
    pass


def gradient_check():
    '''
    梯度檢查
    '''
    # 設計一個誤差函式，取所有節點輸出項之和
    error_function = lambda o:o.sum()

    rl = RecurrentLayer(3,2,IdentityActivator(),1e-3)

    # 計算forward值
    x,d = data_set()
    rl.forward(x[0])
    rl.forward(x[1])
    # 求取sensitivity map
    sensitivity_array = np.ones(rl.state_list[-1].shape,dtype=np.float64)
    # 計算梯度
    rl.backward(sensitivity_array,IdentityActivator())
    # 檢查梯度
    epsilon = 1e-4
    for i in range(rl.W.shape[0]):
        for j in range(rl.W.shape[1]):
            rl.W[i][j] += epsilon
            rl.reset_state()
            rl.forward(x[0])
            rl.forward(x[1])
            err1 = error_function(rl.state_list[-1])
            rl.W[i][j] -= 2*epsilon
            rl.reset_state()
            rl.forward(x[0])
            rl.forward(x[1])
            err2 = error_function(rl.state_list[-1])
            expected_grad = (err1-err2)/(2*epsilon)
            rl.W[i][j] += epsilon
            print('weights(%d%d):expected-actural%f-%f'%(i,j,expected_grad,rl.gradient[i][j]))

深度學習筆記——卷積神經網路

程式碼參考了零基礎入門深度學習(4) - 卷積神經網路這篇文章，我只對程式碼裡可能存在的一些小錯誤進行了更改。至於卷積神經網路的原理以及程式碼裡不清楚的地方可以結合該文章理解，十分淺顯易懂。 import numpy as np from functools import reduce fro

深度學習筆記-卷積神經網路CNN與迴圈神經網路RNN有什麼區別？

CNN與RNN本質的不同就是所基於的假設不同，由於核心假設的不同，導致實現方式的差異。 CNN 首先理解什麼叫做卷積，或者說為什麼要翻譯為卷積神經網路。卷積的定義：https://baike.baidu.com/item/%E5%8D%B7%E7%A7%AF/94110

Google 深度學習筆記卷積神經網路

Convolutional Networks deep dive into images and convolutional models Convnet BackGround 人眼在識別影象時，往往從區域性到全域性區域性與區域性之間聯絡

人工智障學習筆記——深度學習(2)卷積神經網路

上一章最後提到了多層神經網路（deep neural network，DNN），也叫多層感知機（Multi-Layer perceptron,MLP）。當下流行的DNN主要分為應對具有空間性分佈資料的CNN（卷積神經網路）和應對具有時間性分佈資料的RNN（遞迴神經網路，又

深度學習：卷積神經網路，卷積，啟用函式，池化

卷積神經網路——輸入層、卷積層、啟用函式、池化層、全連線層 https://blog.csdn.net/yjl9122/article/details/70198357?utm_source=blogxgwz3 一、卷積層特徵提取輸入影象是32*32*3，3是它的深度（即R

深度學習基礎--卷積神經網路的不變性

卷積神經網路的不變性不變性的實現主要靠兩點：大量資料（各種資料）；網路結構（pooling）不變性的型別 1）平移不變性卷積神經網路最初引入區域性連線和空間共享，就是為了滿足平移不變性。關於CNN中的平移不變性的來源有多種假設。一個想法是平移不變性

【深度學習】卷積神經網路

講卷積神經網路之前說說為什麼能夠進行分類識別？按照傳統的SIFT，HOG演算法都是先進行特徵的提取過程，那麼卷積神經網路怎麼進行特徵的提取呢？下面，我們就開始吧！先提一個小問題：“你是通過什麼瞭解這個世界的？” 當一輛汽車從你身邊疾馳而過，你是通過哪些資訊知道那是一

【深度學習】卷積神經網路的卷積層和池化層計算

一、簡介 \quad\quad 卷積神經網路（Convolutional neural network, CNN），

深度學習（卷積神經網路）問題總結

深度卷積網路涉及問題： 1.每個圖如何卷積：（1）一個圖如何變成幾個？（2）卷積核如何選擇？ 2.節點之間如何連線？ 3.S2-C3如何進行分配？ 4.1

深度學習：卷積神經網路CNN入門

該文是，並假設你理解前饋神經網路。目錄視覺感知畫面識別是什麼識別結果取決於什麼影象表達畫面識別的輸入畫面不變形前饋神經網路做畫面識別的不足卷積神經網路做畫面識別區域性連線空間共享輸出空間表達Depth維的處理Zero padding形狀、概念抓取多filte

深度學習之卷積神經網路入門（2）

卷積神經網路入門學作者：hjimce 卷積神經網路演算法是n年前就有的演算法，只是近年來因為深度學習相關演算法為多層網路的訓練提供了新方法，然後現在電腦的計算能力已非當年的那種計算水平，同時現在的訓練資料很多，於是神經網路的相關演算法又重新火了起來，因此卷積神經網路就又

【深度學習】卷積神經網路CNN基本知識點

卷積神經網路與前面學的常規神經網路很相似，也有輸入、權重、偏差、損失函式、啟用函式、全連線層等概念，之前的一些小的技巧也仍然適用。與常規神經網路的對比卷積神經網路（Convolutional Neural Networks，CNNs / ConvNe

深度學習之卷積神經網路CNN及tensorflow程式碼實現示例詳細介紹

一、CNN的引入在人工的全連線神經網路中，每相鄰兩層之間的每個神經元之間都是有邊相連的。當輸入層的特徵維度變得很高時，這時全連線網路需要訓練的引數就會增大很多，計算速度就會變得很慢，例如一張黑白的 28×28 的手寫數字圖片，輸入層的神經元就有784個，如下圖所示：

乾貨 | 深度學習之卷積神經網路（CNN）的前向傳播演算法詳解

微信公眾號關鍵字全網搜尋最新排名【機器學習演算法】：排名第一【機器學習】：排名第一【Python】：排名第三【演算法】：排名第四前言在（乾貨 | 深度學習之卷積神經網路(CNN)的模型結構）中，我們對CNN的模型結構做了總結，這裡我們就在CNN的模型基礎上，看看CNN的前向傳播演算法是什麼樣

深度學習：卷積神經網路物體檢測之感受野大小計算

1 感受野的概念　　在卷積神經網路中，感受野的定義是卷積神經網路每一層輸出的特徵圖（feature map）上的畫素點在原始影象上對映的區域大小。　　　　RCNN論文中有一段描述，Alexnet網路pool5輸出的特徵圖上的畫

深度學習之卷積神經網路原理詳解（一）

初探CNN卷積神經網路 1、概述典型的深度學習模型就是很深層的神經網路，包含多個隱含層，多隱層的神經網路很難直接使用BP演算法進行直接訓練，因為反向傳播誤差時往往會發散，很難收斂 CNN節省訓練開銷的方式是權共享weight sharing，讓一組神經元

深度學習之卷積神經網路CNN及tensorflow程式碼實現示例

一、CNN的引入在人工的全連線神經網路中，每相鄰兩層之間的每個神經元之間都是有邊相連的。當輸入層的特徵維度變得很高時，這時全連線網路需要訓練的引數就會增大很多，計算速度就會變得很慢，例如一張黑白的 28×28 的手寫數字圖片，輸入層的神經元就有784個，如下圖

乾貨 | 深度學習之卷積神經網路(CNN)的模型結構

微信公眾號關鍵字全網搜尋最新排名【機器學習演算法】：排名第一【機器學習】：排名第一【Python】：排名第三【演算法】：排名第四前言在前面我們講述了DNN的模型與前向反向傳播演算法。而在DNN大類中，卷積神經網路(Convolutional Neural Networks，以下簡稱CNN)是最

深度學習與卷積神經網路（直觀理解）

基本上在輸入影象中，如果有一個形狀是類似於這種濾波器的代表曲線，那麼所有的乘積累加在一起會導致較大的值！現在讓我們看看當我們移動我們的過濾器時會發生什麼。可以看到結果值是0哦，為什麼？還不明白麼，因為耳朵的邊緣和剛剛尾股部曲線太不同了。這樣的多個濾波器就可以在大量資料的訓練下得到大量特徵了

深度學習之卷積神經網路程式設計實現（二）

void conv_bprop(Layer *layer, Layer *prev_layer, bool *pconnection) { int index = 0; int size = prev_layer->map_w * prev_layer->map_h; // delta

深度學習筆記——卷積神經網路

相關推薦