TensorFlow+實戰Google深度學習框架學習筆記（12）------Mnist識別和卷積神經網路LeNet

阿新 • • 發佈：2018-12-01

一、卷積神經網路的簡述

卷積神經網路將一個影象變窄變長。原本【長和寬較大，高較小】變成【長和寬較小，高增加】

卷積過程需要用到卷積核【二維的滑動視窗】【過濾器】，每個卷積核由n*m（長*寬）個小格組成，每個小格都有自己的權重值，

長寬變窄：過濾器的長寬決定的

高度變高：過濾器的個數決定的

二、程式碼：

1、資料集：

下載好Mnist資料集加壓到資料夾'MNIST_data’中。載入資料

import tensorflow.examples.tutorials.mnist.input_data as input_data
mnist = input_data.read_data_sets(' 
MNIST_data',one_hot = True)
#列印資料集大小
print('訓練集大小:',mnist.train.num_examples)
print('驗證集大小:',mnist.validation.num_examples)
print('測試集大小:',mnist.test.num_examples)
#列印樣本
print(mnist.train.images[0])
print(mnist.train.labels[0])

訓練集大小: 55000 驗證集大小: 5000 測試集大小: 10000
x：[0. 0. 0. 0. 0. 0.……0.9960785，……0]

y：[0. 0. 0. 0. 0. 0. 0. 1. 0. 0.]

2、卷積層：tf.nn.conv2d

（1）過濾器：【維度大小、權重w、偏正b、padding、stride】

設定過濾器的引數：

tf.nn.conv2d（輸入矩陣，權重，strides，padding），其中strides的第一個1和最後一個1必須有，中間為輸入矩陣尺寸的x和y的大小。padding有兩種值，SAME和VALLD。

#w,b
filter_w = tf.get_variable('weight',[5,5,3,16],initializer = tf.truncated_normal_initializer(stddev = 0.1))
filter_b  
= tf.get_variable('biases',[16],initializer = tf.constant_initializer(0.1))

#卷積的前向傳播：將【32，32，3】輸入通過 16個 【5，5，3】的過濾器得到【28，28，16】。w ：【5，5，3，16】，b：【16】
conv = tf.nn.conv2d(input,filter_w,strides = [1,1,1,1],padding = 'SAME')
# tf.nn.bias_add表示【5，5，3】個數都要加上biases。
bias = tf.nn.bias_add(conv,biases)

#結果通過Relu啟用函式
actived_conv = tf.nn.relu(bias)

3、池化層：可加快計算速度也可防止過擬合。tf.nn.max_pool

卷積層之間加一個池化層，可縮小矩陣的尺寸，減少全連線層中的引數。

tf.nn.max_pool(傳入當前層的節點矩陣，ksize = 池化層過濾器的尺寸，strides，padding），ksize的第一維和最後一維必須為1

實現了最大池化層的前向傳播過程，引數和conv2d相似。

4、全部程式碼：

#載入模組和資料
import tensorflow as tf
from tensorflow.examplesamples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("MNIST_data/",one_hot = True)

#引數的設定
def weight_variable(shape):
    initial = tf.truncated_normal(shape,stddev = 0.1)
    return tf.Variable(initial)

def biase_variable(shape):
    initial = tf.constant(0.1,shape = shape)
    return tf.Variable(initial)
def conv2d(x,w):
    conv = tf.nn.conv2d(x,w,strides=[1,1,1,1],padding='SAME')
    return conv
def max_pool(x):
    return tf.nn.max_pool(x,ksize = [1,2,2,1],strides = [1,2,2,1],padding = 'SAME')

#訓練
def train(mnist):
    x = tf.placeholder(tf.float32,[None,784])
    y = tf.placeholder(tf.float32,[None,10])
    keep_prob =  tf.placeholder(tf.float32)
    x_image = tf.reshape(x,[-1,28,28,1])
    
    #前向傳播
    #layer1
    with tf.variable_scope('layer1'):
        w = weight_variable([5,5,1,32])
        b = biase_variable([32])
        conv1 = tf.nn.bias_add(conv2d(x_image,w),b)
        relu_conv1 = tf.nn.relu(conv1)
        pool1 = max_pool(relu_conv1)
    with tf.variable_scope('layer2'):
        w = weight_variable([5,5,32,64])
        b = biase_variable([64])
        conv2 = tf.nn.bias_add(conv2d(pool1,w),b)
        relu_conv2 = tf.nn.relu(conv2)
        pool2 = max_pool(relu_conv2)
    with tf.variable_scope('func1'):
        w = weight_variable([7*7*64,1024])
        b = biase_variable([1024])
        pool2_reshape = tf.reshape(pool2,[-1,7*7*64])
        func1 = tf.nn.relu(tf.matmul(pool2_reshape,w) + b)
        func1_drop = tf.nn.dropout(func1,keep_prob)
    with tf.variable_scope('func2'):
        w = weight_variable([1024,10])
        b = biase_variable([10])
        prediction = tf.nn.softmax(tf.matmul(func1_drop,w) + b)
        
    #後向傳播
    cross_entropy = tf.reduce_mean(-tf.reduce_sum(y * tf.log(prediction),
                                                  reduction_indices=[1]))       # loss
    train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)
    
    #會話訓練
    sess = tf.Session()
    if int((tf.__version__).split('.')[1]) < 12 and int((tf.__version__).split('.')[0]) < 1:
        init = tf.initialize_all_variables()
    else:
        init = tf.global_variables_initializer()
    sess.run(init)
    for i in range(1000):
        batch_x, batch_y = mnist.train.next_batch(100)
        sess.run(train_step, feed_dict={x: batch_x, y: batch_y, keep_prob: 0.5})
        if i % 50 == 0:
            correct_prediction = tf.equal(tf.argmax(prediction,1), tf.argmax(y,1))
            accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))
            result = sess.run(accuracy, feed_dict={x: mnist.test.images[:1000], y: mnist.test.labels[:1000], keep_prob: 1})
            print(result)

if __name__ == '__main__':
    train(mnist)

訓練結果：迭代結束為95%的準確率。

TensorFlow+實戰Google深度學習框架學習筆記（12）------Mnist識別和卷積神經網路LeNet

一、卷積神經網路的簡述卷積神經網路將一個影象變窄變長。原本【長和寬較大，高較小】變成【長和寬較小，高增加】卷積過程需要用到卷積核【二維的滑動視窗】【過濾器】，每個卷積核由n*m（長*寬）個小格組成，每個小格都有自己的權重值，長寬變窄：過濾器的長寬決定的高度變高：過濾器的個數決定的 &nb

TensorFlow+實戰Google深度學習框架學習筆記（13）------Mnist識別和卷積神經網路AlexNet

一、AlexNet：共8層：5個卷積層（卷積+池化）、3個全連線層，輸出到softmax層，產生分類。論文中lrn層推薦的引數：depth_radius = 4，bias = 1.0 , alpha = 0.001 / 9.0 , beta = 0.75 lrn現在僅在AlexNet中使用，

TensorFlow+實戰Google深度學習框架學習筆記（13）------Mnist識別和卷積神經網絡AlexNet

net dev adding 筆記 learn 明顯 lex test info 一、AlexNet：共8層：5個卷積層（卷積+池化）、3個全連接層，輸出到softmax層，產生分類。論文中lrn層推薦的參數：depth_radius = 4，bias = 1.0 ,

TensorFlow：實戰Google深度學習框架（五）影象識別與卷積神經網路

第6章影象識別與卷積神經網路本章通過利用CNN實現影象識別的應用來說明如何使用TensorFlow實現卷積神經網路 6.1 影象識別問題簡介及經典資料集 1. Cifar Cifar-10：10種不同種類的60000張影象，畫素大小為3

CNN筆記（一）：通俗理解卷積神經網路

在深度學習中，有一個很重要的概念，就是卷積神經網路（CNN），是入門深度學習需要搞懂的東西。 1 卷積網路也叫卷積神經網路（convolutional neural networ

Deep Learning（深度學習）學習筆記整理系列之（七）Convolutional Neural Networks卷積神經網路

轉處：http://blog.csdn.net/zouxy09/article/details/8781543/ Deep Learning（深度學習）學習筆記整理系列作者：Zouxy version 1.0 2013-04-08 宣告： 1）該Deep

Tensorflow（三）訓練一個簡單卷積神經網路

這是吳恩達老師第四課第一週的程式設計練習，題目是分析圖片中手勢得到手所表示的數字。特別要注意的是，如果你使用的是新版本的tensorflow，很有可能得到的結果和Coursera上的有所不同！ 1. 先簡單介紹一個CNN（直接看程式碼的請往下翻） CNN全程是

機器學習筆記（十二）：TensorFlow實戰四（影象識別與卷積神經網路）

1 - 卷積神經網路常用結構 1.1 - 卷積層我們先來介紹卷積層的結構以及其前向傳播的演算法。一個卷積層模組，包含以下幾個子模組：使用0擴充邊界(padding) 卷積視窗過濾器（filter）前向卷積反向卷積（可選） 1.1

機器學習筆記（十二）：TensorFlow實現四（影象識別與卷積神經網路）

1 - 卷積神經網路常用結構 1.1 - 卷積層我們先來介紹卷積層的結構以及其前向傳播的演算法。一個卷積層模組，包含以下幾個子模組：使用0擴充邊界(padding) 卷積視窗過濾器（filter）前向卷積反向卷積（可選） 1.1.2 - 邊界填充

tensorflow學習筆記——影象識別與卷積神經網路

　　無論是之前學習的MNIST資料集還是Cifar資料集，相比真實環境下的影象識別問題，有兩個最大的問題，一是現實生活中的圖片解析度要遠高於32*32，而且影象的解析度也不會是固定的。二是現實生活中的物體類別很多，無論是10種還是100種都遠遠不夠，而且一張圖片中不會只出現一個種類的物體。為了更加貼近真實環境

Deep Learning.ai學習筆記_第四門課_卷積神經網路

目錄第一週卷積神經網路基礎第二週深度卷積網路：例項探究第三週目標檢測第四周特殊應用：人臉識別和神經風格轉換第一週卷積神經網路基礎垂直邊緣檢測器，通過卷積計算，可以把多維矩陣進行降維。如下圖：卷積運算提供了一個方便的方法來發

深度學習（十五）基於級聯卷積神經網路的人臉特徵點定位

基於級聯卷積神經網路的人臉特徵點定位作者：hjimce一、相關理論本篇博文主要講解2013年CVPR的一篇利用深度學習做人臉特徵點定位的經典paper：《Deep Convolutional Netwo

深度學習 CNN卷積神經網路 LeNet-5詳解

卷積神經網路（ Convolutional Neural Network, CNN）：是一種常見的深度學習架構，受生物自然視覺認知機制(動物視覺皮層細胞負責檢測光學訊號)啟發而來，是一種特殊的多層前饋神經網路。它的人工神經元可以響應一部分覆蓋範圍

深度學習（二十七）視覺化理解卷積神經網路（反池化 pooling unpooling）

本篇博文主要講解2014年ECCV上的一篇經典文獻：《Visualizing and Understanding Convolutional Networks》，可以說是CNN領域視覺化理解的開山之作，這篇文獻告訴我們CNN的每一層到底學習到了什麼特徵，然後作者通過視覺化進行調整網路，提高了精度。最近兩年深層