深度學習(DL)與卷積神經網路(CNN)學習筆記隨筆-01-CNN基礎知識點

阿新 • • 發佈：2019-01-05

神經認知機。
　卷積神經網路是受生物靈感的多層感知機的變體。從Hubel和Wiesel的早期對貓的視覺皮層的研究工作中得出，視覺皮層包含一組複雜的細胞排列。這些細胞會對很小的子區域敏感，稱作Receptive Field（感受野細胞）。根據這個概念提出了神經認知機。它的主要作用就是Recept部分影象資訊（或特徵），然後通過分層區域性相連，將各個區域性特徵組合成整個影象特徵。需要仔細閱讀的論文包括：
　(1) 第一篇關於感受野功能的論文Receptive fields and functional architecture of monkey striate cortex,1968
　(2) the NeoCognitron

A self-organizing neural network model for a mechanism of pattern recognition unaffected by shift in position,1980
　(3) HMAX Robust object recog-nition with cortex-like mechanisms,2007
　(4) 非常重要的LeNet-5 Gradient-based learning applied to document recognition,1998
　
稀疏連線。
　CNN層與層之間的連線並不全是全連線，而是區域性連線，它的作用就是大幅度減少引數。

圖1 層間連線示意圖
權值共享。
　在CNNs中，每一種過濾器都可以通過重複堆疊而覆蓋整個視野。這種堆疊就是複製自己，因此它們的單元共享同一個權值和偏置值，從而形成一張特徵圖。
　
　圖2中m層是由3個隱層單元構成的一張特徵圖。相同顏色的權值是共享的。梯度下降法仍然可以用來訓練它們所共享的引數，不過需要在原演算法基礎上進行小的改動。共享權值的梯度就是簡單的對每個共享引數的梯度求和得到。

圖2 權值共享圖
詳細計算說明。
　為了更豐富的表示資料特徵，每個隱藏層會包含多個特徵圖。
　定義 hk代表某層的第k個特徵圖。
　公式 hkij=tanh((Wk∗x)ij+bk)

用來計算hk ；其中∗是卷積操作。
　以上公式是如何計算特徵圖的呢？是通過針對整個影象中不同的子區域資料，重複的呼叫同一個函式，最終覆蓋整幅影象時，就得到了一張特徵圖。換句話說，就是用帶有偏置項(bk)的線性濾波器(Wk)與輸入影象(x)進行卷積運算(∗)，再將結果通過一個非線性函式(tanh)所得到的結果(hk)。
　
圖3 舉例，一層中含4個特徵圖
　　圖3中的CNN含有2層，m−1層包含4個特徵圖，m層包含2個特徵圖，記為h0和h1，h0和h1是由不同的卷積核在前一層所有map上作卷積並將對應元素累加後加一個偏置，再求sigmod得到的(假設m與m-1層全連線，則m層共有4*2=8個卷積核)。其中，h0和h1的權值W0和W1是一個3維張量，第一維表示前一層特徵圖的下標，後兩維表示該特徵圖的座標。綜合起來，Wklij表示m層第k個特徵圖的每一個畫素點的權重與m−1層第l個特徵圖的(i,j)畫素點的權重相連線。
　　
卷積運算。
　　用的是著名的Python庫Theano. ConvOp。具體如何使用及執行效果，見我的另外一篇部落格Python之Theano.ConvOp，講的很詳細。
　　
最大池化。
　　CNN中另外一個很重的概念就是最大池化。它是一種非線性的下采樣（個人理解其作用類似於降維）方法。最大池化把輸入影象劃分不相重疊的影象矩陣塊，每一個子區域輸出其最大值。最大池化方法在視覺處理問題中非常有效的兩個原因是：
　(1) 通過減少非最大值來降低對上層的計算複雜度。
　(2) 池化結果支援平移不變性。在卷積層中，每個畫素點有8個方向可以平移。當最大池化視窗為2∗2區域時，其中有3個方向會產生相同結果；當最大池化視窗為3∗3區域時，則會有5個方向會產生相同的結果。
　在Theano中的應用舉例就不介紹了。

深度學習(DL)與卷積神經網路(CNN)學習筆記隨筆-01-CNN基礎知識點

神經認知機。　卷積神經網路是受生物靈感的多層感知機的變體。從Hubel和Wiesel的早期對貓的視覺皮層的研究工作中得出，視覺皮層包含一組複雜的細胞排列。這些細胞會對很小的子區域敏感，稱作

深度學習(DL)與卷積神經網路(CNN)學習筆記隨筆-03-基於Python的LeNet之LR

　　0階張量叫標量(scarlar)；1階張量叫向量(vector)；2階張量叫矩陣(matrix) 　　　　本文主要內容：如何用python中的theano包實現最基礎的分類器–LR(Logistic Regression)。　　一、模型

深度學習與卷積神經網路（直觀理解）

基本上在輸入影象中，如果有一個形狀是類似於這種濾波器的代表曲線，那麼所有的乘積累加在一起會導致較大的值！現在讓我們看看當我們移動我們的過濾器時會發生什麼。可以看到結果值是0哦，為什麼？還不明白麼，因為耳朵的邊緣和剛剛尾股部曲線太不同了。這樣的多個濾波器就可以在大量資料的訓練下得到大量特徵了

TensorFlow：實戰Google深度學習框架（五）影象識別與卷積神經網路

第6章影象識別與卷積神經網路本章通過利用CNN實現影象識別的應用來說明如何使用TensorFlow實現卷積神經網路 6.1 影象識別問題簡介及經典資料集 1. Cifar Cifar-10：10種不同種類的60000張影象，畫素大小為3

機器學習筆記（十二）：TensorFlow實戰四（影象識別與卷積神經網路）

1 - 卷積神經網路常用結構 1.1 - 卷積層我們先來介紹卷積層的結構以及其前向傳播的演算法。一個卷積層模組，包含以下幾個子模組：使用0擴充邊界(padding) 卷積視窗過濾器（filter）前向卷積反向卷積（可選） 1.1

[深度學習] Python實現卷積神經網路- Convolution

[深度學習] Python實現卷積神經網路- Convolution 作者 sunsided github 地址： https://github.com/sunsided/python-conv2d import cv2 import numpy as np # load the

深度學習入門——利用卷積神經網路訓練CIFAR—10資料集

CIFAR-10資料集簡介 CIFAR-10是由Hinton的學生Alex Krizhevsky和Ilya Sutskever整理的一個用於普適物體的小型資料集。它一共包含10個類別的RGB彩色圖片：飛機、汽車、鳥類、貓、鹿、狗、蛙類、馬、船：資料集包含50000張訓練圖片和1000

【深度學習系列】卷積神經網路CNN原理詳解(一)——基本原理

轉自：https://www.cnblogs.com/charlotte77/p/7759802.html 上篇文章我們給出了用paddlepaddle來做手寫數字識別的示例，並對網路結構進行到了調整，提高了識別的精度。有的同學表示不是很理解原理，為什麼傳統的機

深度學習之3D卷積神經網路

一、概述 3D CNN主要運用在視訊分類、動作識別等領域，它是在2D CNN的基礎上改變而來。由於2D CNN不能很好的捕獲時序上的資訊，因此我們採用3D CNN，這樣就能將視訊中時序資訊進行很好的利用。首先我們介紹一下2D CNN與3D CNN的區別。如圖1所示，a)和b

機器學習筆記（十二）：TensorFlow實現四（影象識別與卷積神經網路）

1 - 卷積神經網路常用結構 1.1 - 卷積層我們先來介紹卷積層的結構以及其前向傳播的演算法。一個卷積層模組，包含以下幾個子模組：使用0擴充邊界(padding) 卷積視窗過濾器（filter）前向卷積反向卷積（可選） 1.1.2 - 邊界填充

深度學習（四）卷積神經網路入門學習(1)

卷積神經網路入門學(1)作者：hjimce卷積神經網路演算法是n年前就有的演算法，只是近年來因為深度學習相關演算法為多層網路的訓練提供了新方法，然後現在電腦的計算能力已非當年的那種計算水平，同時現在的訓練資料很多，於是神經網路的相關演算法又重新火了起來，因此卷積神經網路就又活

吳恩達deeplearning.ai第四課學習心得：卷積神經網路與計算機視覺

不久前，Coursera 上放出了吳恩達 deeplearning.ai 的第四門課程《卷積神經網路》。本文是加拿大國家銀行首席分析師 Ryan Shrott 在完成該課程後所寫的學習心得，有助於大家直觀地瞭解、學習計算機視覺。我最近在 Coursera 上完成了吳恩達教授的計算機視覺課程。吳恩達

深度學習小白——卷積神經網路視覺化（二）

一、由卷積後的code得到原始影象可以看出隨著卷積網路的進行，越來越多的資訊被扔掉了，能還原除的資訊也就越少。二、Deep Dream google發明的起初是用來看神經網路各層在“看”什麼，後來因為得到的影象很具有藝術感，所以成為了一個藝術圖片生成器。這是一

深度學習1——深度學習（四）卷積神經網路入門學習(1)

卷積神經網路入門學(1) 轉載自：hjimce的專欄 - 部落格頻道 - CSDN.NET 原文地址：http://blog.csdn.NET/hjimce/article/details/47323463 作者：hjimce 卷積

【深度學習技術】卷積神經網路常用啟用函式總結

本文記錄了神經網路中啟用函式的學習過程，歡迎學習交流。神經網路中如果不加入啟用函式，其一定程度可以看成線性表達，最後的表達能力不好，如果加入一些非線性的啟用函式，整個網路中就引入了非線性部分，增加了網路的表達能力。目前比較流行的啟用函式主要分為以下7種：

吳恩達深度學習第四課：卷積神經網路（學習筆記2）

前言 1.之所以堅持記錄，是因為看到其他人寫的優秀部落格，內容準確詳實，思路清晰流暢，這也說明了作者對知識的深入思考。我也希望能儘量將筆記寫的準確、簡潔，方便自己回憶也方便別人參考； 2.昨天看到兩篇關於計算機視覺的發展介紹的文章：[觀點|朱鬆純：初探計算機

深度學習入門——利用卷積神經網路實現MNIST手寫數字識別

MNIST（Modified National Institute of Standards and Technology）資料庫是一個大型手寫數字資料庫，通常用於訓練各種影象處理系統。該資料庫還廣泛用於機器學習領域的培訓和測試。它是通過重新打亂來自NIST原始資料集的樣本而

tensorflow學習筆記——影象識別與卷積神經網路

　　無論是之前學習的MNIST資料集還是Cifar資料集，相比真實環境下的影象識別問題，有兩個最大的問題，一是現實生活中的圖片解析度要遠高於32*32，而且影象的解析度也不會是固定的。二是現實生活中的物體類別很多，無論是10種還是100種都遠遠不夠，而且一張圖片中不會只出現一個種類的物體。為了更加貼近真實環境

深度學習三：卷積神經網路

# 卷積神經網路 **卷積神經網路（Convolutional Neural Network，CNN）**又叫**卷積網路（Convolutional Network）**，是一種專門用來處理具有類似網格結構的資料的神經網路。卷積神經網路一詞中的卷積是一種特殊的線性運算。卷積網路是指那些至少在網路的一層中使

論文學習-系統評估卷積神經網路各項超引數設計的影響-Systematic evaluation of CNN advances on the ImageNet

寫在前面論文狀態：Published in CVIU Volume 161 Issue C, August 2017 論文地址：https://arxiv.org/abs/1606.02228 github地址：https://github.com/ducha-aiki/caffenet-benchmar

深度學習(DL)與卷積神經網路(CNN)學習筆記隨筆-01-CNN基礎知識點

相關推薦