cs231n-學習筆記-05卷積神經網路

阿新 • • 發佈：2018-12-09

卷積神經網路

1 簡介

全連線網路層

32x32x3的影象->伸展成3072x1

輸入x (3072,1)

計算Wx (10,3072) x (3072,1) = (10,1)

輸出y (10,1)

卷積網路層

卷積核的深度總是和輸出體的深度相同。

卷積網路由一些卷積層組成，中間穿插啟用函式。

一個卷積核->一個啟用層

步長一定要匹配

一般情況下，我們看到的卷積層的步長是1，卷積核的大小是FxF,補零為(F-1)/2。這將保留空間大小。

32x32的卷積輸入用5x5的卷積核提取特徵，使得在空間上體積減小。（32->28->24…）大小縮小的太快並不好，不能很好地提取影象特徵。

小結

（1）接受輸入維度 $W_{1} \times H_{1} \times D_{1}$

（2）需要四個超引數

卷積核的個數 $K$ 卷積核的個數一般是2的次冪，比如32， 64， 128， 512

卷積核長寬 $F$

步長 $S$

0填充的個數 $P$

（3）計算輸出維度 $W_{2} \times H_{2} \times D_{2}$

$W_{2} = (W_{1} - F + 2 P) / S + 1$

$H_{2} = (H_{1} - F + 2 P) / S + 1$

$D_{2} = K$

（4）引數， $F \times F \times D 1 \times K$ 和 $K$ 個偏置

補：

1x1的卷積層真的很有意義

56x56x64 32個1x1x64 執行64維點乘 56x56x32

池化層

使卷積核更小，更易於管理。

獨立地執行每個啟用層。

池化層的卷積核2x2並且步長為2

小結

（1）接受輸入維度 $W_{1} \times H_{1} \times D_{1}$

（2）需要三個超引數：

卷積核空間擴充套件 $F$

步長 $S$

（3）輸出大小：

$W_{2} = (W_{1} - F) / S + 1$

$H_{2} = (H_{1} - F) / S + 1$

$D_{1} = D_{2}$

（4）引入引數0，因為它計算輸出的固定函式

（5）池化層一般不使用0邊距

全連線層

包含連線輸出單元的神經元，就像之前學過的神經網路。

總結

（1）卷積網路包括卷積層、池化層和全連線層

（2）更喜歡更小的卷積核大小，更深的網路結構

（3）希望沒有池化層或者全連線層，僅僅包含卷積層

（4）典型的卷積網路結構是 [(卷積-relu)xN-池化?]xm-(全連線-relu)xK,softmax

其中N大約是5，M相對較大，K在0-2之間，但是這種經典架構逐漸在發生輕微的變化。

2 架構學習

AlexNet

VGG

GoogleNet

ResNet

回顧

LeNet-5結構

卷積核5x5，步長為1，池化層2x2，步長為2，結構[卷積1-池化1-卷積2-池化2-全連線1-全連線2]

2.1 AlexNet

結構[卷積1-池化1-歸一化1-卷積2-池化2-歸一化2-卷積3-卷積4-卷積5-池化3-全連線1-全連線2-全連線3]

輸入227x227x3=

卷積1：96個11x11的卷積核，步長為4 （引數，11x11x3x96）

輸出55x55x96（[55x55x48]x2）

池化1：3x3過濾器，步長為2（引數，0）

輸出27x27x96

歸一化1：（引數，0）

輸出27x27x96

卷積2：256個5x5的卷積核，步長為1，邊距為2（引數，5x5x96x256）

輸出27x27x256

池化2：3x3過濾器，步長為2（引數，0）

輸出13x13x256

歸一化2：（引數，0）

輸出13x13x256

卷積3：384個3x3的卷積核，步長為1，邊距為1（引數，3x3x256x384）

輸出13x13x384

卷積4：384個3x3的卷積核，步長為1，邊距為1（引數，3x3x384x384）

輸出13x13x384

卷積5：256個3x3的卷積核，步長為1，邊距為1（引數，3x3x384x256）

輸出13x13x256

池化3：3x3的過濾器，步長為2（引數，0）

輸出6x6x256

全連線1：4096神經元

全連線2：4096神經元

全連線3：1000神經元

細節引數：

① 首先使用relu；

② 使用歸一化，使資料不再普通；

③ 資料增廣

④ dropout概率設定為0.5

⑤ 批大小設定為128

⑥ SGD動量設定為0.9

⑦ 學習率設定為0.01，每次較小10

⑧ 當驗證集的精確度穩定之後，L2權重衰減設定為5e-4，7個CNN整合誤差從18.2%下降到15.4%

注：

① 在GTX580的GPU上僅僅用3GB的記憶體訓練，網路分佈在兩個GPU上，每個GPU上有一半的神經元（特徵對映）

② 卷積1,2,4,5通過特徵對映在同樣的的GPU上連線

③ 卷積3，全連線6,7,8根據所有的特徵對映與前面的層連線，他們之間通過GPU通訊

2.2 VGGNet

更小的卷積核，更深的網路

Q：為什麼使用更小的卷積核？（3x3的卷積核）

3x3的卷積核步長為1的層與7x7的卷積層有同樣的有效感受區域

結構[卷積1-卷積2-池化1-卷積3-卷積4-池化2-卷積5-卷積6-卷積7-池化3-卷積8-卷積9-卷積10-池化4-卷積11-卷積12-卷積13-池化5-全連線1-全連線2-全連線3-softmax]

輸入224x224x3

卷積1：224x224x64（引數，3x3x3x64）

卷積2：224x224x64（引數，3x3x64x64）

池化1：112x112x64（引數，0）

卷積3：112x112x128（引數，3x3x64x128）

卷積4：112x112x128（引數，3x3x128x128）

池化2：56x56x128（引數，0）

卷積5：56x56x256（引數，3x3x128x256）

卷積6：56x56x256（引數，3x3x256x256）

卷積7：56x56x256（引數，3x3x256x256）

池化3：28x28x256（引數，0）

卷積8：28x28x512（引數，3x3x256x512）

卷積9：28x28x512（引數，3x3x512x512）

卷積10：28x28x512（引數，3x3x512x512）

池化4：14x14x512（引數，0）

卷積11：14x14x512（引數，3x3x512x512）

卷積12：14x14x512（引數，3x3x512x512）

卷積13：14x14x512（引數，3x3x512x512）

池化5：7x7x512（引數，0）

全連線1：1x1x4096（引數，7x7x512x4096）

全連線2：1x1x4096（引數，4096x4096）

全連線3：1x1x1000（引數，4096x1000）

2.3 GoogleNet

更深的網路，計算更高效

22層，開始的模組很高效，沒有全連線層，只有500萬個引數（比AlexNet少了12倍）

2.4 ResNet

越深的網路越難優化

ResNet的結構：

（1）堆積殘差快；

（2）每個殘差快有兩個3x3的卷積層；

（3）使卷積核的數量變為原來的2倍，在空間上向下取樣，步長為2（每個維度除以2）

（4）在一開始新增額外的卷積層

（5）在結束出不使用全連線層，（僅僅包含1000的全連線到輸出分類）

引數：

（1）在每個卷積層後面進行歸一化處理；

（2）Xavier/2初始化；

（3）SGD+Momentum（引數0.9）

（4）學習率，0.1，當驗證集誤差趨於平穩的時候除以10；

（5）小批大小，256；

（6）權重衰退，1e-5；

（7）沒有使用dropout

實驗結果：

（1）能夠在不退化的情況下，訓練非常深的網路；

（2）如期望的一樣，更深的網路得到更低的訓練誤差；

3 總結

（1）VGG,GoogleNet,ResNet使用的都很廣泛，在模型庫都能夠輕鬆的得到；

（2）殘差網路是目前最好的，通常將其設定為預設；

（3）有向更深的網路演化的趨勢；

（4）重要的研究方向主要在層的設計、跳過連線和提高梯度流；

（5）最近的研究趨向於深度對的必要性與廣度，殘差連線之間的較量；

cs231n-學習筆記-05卷積神經網路

卷積神經網路 1 簡介全連線網路層 32x32x3的影象->伸展成3072x1 輸入x (3072,1) 計算Wx (10,3072) x (3072,1) = (10,1) 輸出y (10,1) 卷積網路層

Tensorflow學習筆記(五)——卷積神經網路實現

今天來實現tensorflow架構下的卷積神經網路，首先了解清楚我們要構建的網路架構，資料集還是用mnist，所以輸入還是28X28。建立的卷積神經網路架構是：卷積層->pooling層->卷積層->pooling層->全連線層1->全連線層2。全連線層

TensorFlow學習筆記(7) 卷積神經網路簡介

前面所提到的MNIST是一個相對簡單的資料集，而在其他更復雜的影象識別資料集上，卷積神經網路有更好的表現。比如Cifar資料集和ImageNet資料集。Cifar分為Cifar-10和Cifar-100兩個問題，都是32*32的彩色圖片，Cifar-10問題收集了來自10個不同種類的60000張圖片

《TensorFlow學習筆記》卷積神經網路CNN實戰-cifar10資料集（tensorboard視覺化）

IDE：pycharm Python: Python3.6 OS: win10 tf : CPU版本程式碼可在github中下載，歡迎star，謝謝 CNN-CIFAR-10 一、CIFAR10資料集資料集程式碼下載 from te

深度學習筆記：卷積神經網路的Tensorflow實現

在上一講中，我們學習瞭如何利用 numpy 手動搭建卷積神經網路。但在實際的影象識別中，使用 numpy 去手寫 CNN 未免有些吃力不討好。在 DNN 的學習中，我們也是在手動搭建之後利用 Tensorflow 去重新實現一遍，一來為了能夠對神經網路的傳播機制能夠理

吳恩達深度學習筆記之卷積神經網路(目標檢測)

3.1 目標定位定位分類問題意味著我們不僅要用演算法判斷出圖片中是否有該物體，還要標記出它的位置，例如圖片有一輛汽車，我們需要用邊框把汽車圈起來。影象分類問題已不陌生，例如輸入一張圖片到多層卷積神經網路，它會輸出一個特徵向量，並反饋給softmax來預測

tensorflow學習筆記：卷積神經網路最終筆記

　　這已經是我的第四篇部落格學習卷積神經網路了。之前的文章分別是：　　1，Keras深度學習之卷積神經網路（CNN），這是開始學習Keras，瞭解到CNN，其實不懂的還是有點多，當然第一次筆記主要是給自己心中留下一個印象，知道什麼是卷積神經網路，當然主要是學習Keras，順便走一下CNN的過程。　　2，深

吳恩達深度學習系列課程筆記：卷積神經網路（一）

本系列文章將對吳恩達在網易公開課“深度學習工程師”微專業內容進行筆記總結，這一部分介紹的是“卷積神經網路”部分。 1、計算機視覺計算機視覺在我們還是生活中有非常廣泛的應用，以下幾個是最常見的例子：影象分類：可以對影象中的物體種類進行判斷，如確定影象中

深度學習(DL)與卷積神經網路(CNN)學習筆記隨筆-01-CNN基礎知識點

神經認知機。　卷積神經網路是受生物靈感的多層感知機的變體。從Hubel和Wiesel的早期對貓的視覺皮層的研究工作中得出，視覺皮層包含一組複雜的細胞排列。這些細胞會對很小的子區域敏感，稱作

吳恩達深度學習課程筆記之卷積神經網路基本操作詳解

卷積層 CNN中卷積層的作用： CNN中的卷積層，在很多網路結構中會用conv來表示，也就是convolution的縮寫。卷積層在CNN中扮演著很重要的角色——特徵的抽象和提取，這也是CNN區別於傳統的ANN或SVM的重要不同。對於圖片而

深度學習(DL)與卷積神經網路(CNN)學習筆記隨筆-03-基於Python的LeNet之LR

　　0階張量叫標量(scarlar)；1階張量叫向量(vector)；2階張量叫矩陣(matrix) 　　　　本文主要內容：如何用python中的theano包實現最基礎的分類器–LR(Logistic Regression)。　　一、模型

pytorch入門——邊學邊練05卷積神經網路

訪問本站觀看效果更佳寫在前面前面講了一堆堆基礎的東西，現在我們再來看看複雜一點的知識吧。後續會再講講RNN、Resnet等等。慢慢來吧～後面會慢慢複雜起來。後面的文章結構大體上分為兩大塊：介紹網路結構、介紹如何用pytorch實現。限於篇幅，可能會有一些知識點分散在前面的文章裡，

論文學習-系統評估卷積神經網路各項超引數設計的影響-Systematic evaluation of CNN advances on the ImageNet

寫在前面論文狀態：Published in CVIU Volume 161 Issue C, August 2017 論文地址：https://arxiv.org/abs/1606.02228 github地址：https://github.com/ducha-aiki/caffenet-benchmar

Tensorflow學習教程------利用卷積神經網路對mnist資料集進行分類_利用訓練好的模型進行分類

#coding:utf-8 import tensorflow as tf from PIL import Image,ImageFilter from tensorflow.examples.tutorials.mnist import input_data def imageprepare(ar

【基於tensorflow的學習】經典卷積神經網路、模型的儲存和讀取

CNN發展史： 1.經典卷積神經網路以下僅列出關於CNN的深層次理解：卷積層 tensorflow中卷積層的建立函式：_conv1 = tf.nn.conv2d(_input_r, tf.Variable(tf.random_normal([3, 3, 1, 6

[深度學習] Python實現卷積神經網路- Convolution

[深度學習] Python實現卷積神經網路- Convolution 作者 sunsided github 地址： https://github.com/sunsided/python-conv2d import cv2 import numpy as np # load the

# [cs231n （九）卷積神經網路 ][1]

標籤（空格分隔）：神經網路 0.回顧 cs231n （一）影象分類識別講了KNN cs231n （二）講了線性分類器：SVM和SoftMax cs231n （三）優化問題及方法 cs231n （四）反向傳播 cs231n （五）神經網路 part 1:

深度學習入門——利用卷積神經網路訓練CIFAR—10資料集

CIFAR-10資料集簡介 CIFAR-10是由Hinton的學生Alex Krizhevsky和Ilya Sutskever整理的一個用於普適物體的小型資料集。它一共包含10個類別的RGB彩色圖片：飛機、汽車、鳥類、貓、鹿、狗、蛙類、馬、船：資料集包含50000張訓練圖片和1000

【深度學習系列】卷積神經網路CNN原理詳解(一)——基本原理

轉自：https://www.cnblogs.com/charlotte77/p/7759802.html 上篇文章我們給出了用paddlepaddle來做手寫數字識別的示例，並對網路結構進行到了調整，提高了識別的精度。有的同學表示不是很理解原理，為什麼傳統的機

深度學習之3D卷積神經網路

一、概述 3D CNN主要運用在視訊分類、動作識別等領域，它是在2D CNN的基礎上改變而來。由於2D CNN不能很好的捕獲時序上的資訊，因此我們採用3D CNN，這樣就能將視訊中時序資訊進行很好的利用。首先我們介紹一下2D CNN與3D CNN的區別。如圖1所示，a)和b

cs231n-學習筆記-05卷積神經網路

卷積神經網路

1 簡介

2 架構學習

2.1 AlexNet

2.2 VGGNet

2.3 GoogleNet

2.4 ResNet

3 總結

相關推薦