基於tensorflow的MNIST手寫數字識別（三）--神經網路篇

阿新 • • 發佈：2019-02-12

想想還是要說點什麼

抱歉啊，第三篇姍姍來遲，確實是因為我懶，而不是忙什麼的，所以這次再加點料，以表示我的歉意。廢話不多說，我就直接開始講了。

加入神經網路的意義

前面也講到了，使用普通的訓練方法，也可以進行識別，但是識別的精度不夠高，因此我們需要對其進行提升，其實MNIST官方提供了很多的組合方法以及測試精度，並做成了表格供我們選用，谷歌官方為了保證教學的簡單性，所以用了最簡單的卷積神經網路來提升這個的識別精度，原理是通過強化它的特徵（比如輪廓等），其實我也剛學，所以能看懂就說明它確實比較簡單。
- 我的程式碼都是在0.7版本的tensorflow上實現的，建議看一下前兩篇文章先。

流程和步驟

其實流程跟前面的差不多,只是在softmax前進行了卷積神經網路的操作，所也就不仔細提出了，這裡只說卷積神經網路的部分。
如第一篇文章所說，我們的卷積神經網路的，過程是卷積->池化->全連線.

# 卷積函式
# convolution
def conv2d(x, W):
    return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME')
#這裡tensorflow自己帶了conv2d函式做卷積，然而我們自定義了個函式，用於指定步長為1，邊緣處理為直接複製過來



# pooling 

def max_pool_2x2(x):
    return tf.nn.max_pool(x, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')

tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, name=None)

Computes a 2-D convolution given 4-D input and filter tensors.

Given an input tensor of shape [batch, in_height, in_width, in_channels] and a filter / kernel tensor of shape [filter_height, filter_width, in_channels, out_channels], this op performs the following:

Flattens the filter to a 2-D matrix with shape [filter_height * filter_width * in_channels, output_channels].

Extracts image patches from the the input tensor to form a virtual tensor of shape [batch, out_height, out_width, filter_height * filter_width * in_channels].

For each patch, right-multiplies the filter matrix and the image patch vector.
In detail,

output[b, i, j, k] =
sum_{di, dj, q} input[b, strides[1] * i + di, strides[2] * j + dj, q] *
filter[di, dj, q, k]

Must have strides[0] = strides[3] = 1. For the most common case of the same horizontal and vertices strides, strides = [1, stride, stride, 1].

Args:

input: A Tensor. Must be one of the following types: float32, float64.

filter: A Tensor. Must have the same type as input.

strides: A list of ints. 1-D of length 4. The stride of the sliding window for each dimension of input.

padding: A string from: “SAME”, “VALID”. The type of padding algorithm to use.

use_cudnn_on_gpu: An optional bool. Defaults to True.

name: A name for the operation (optional).

Returns:

A Tensor. Has the same type as input.

tf.nn.max_pool(value, ksize, strides, padding, name=None)

Performs the max pooling on the input.

Args:

value: A 4-D Tensor with shape [batch, height, width, channels] and type float32, float64, qint8, quint8, qint32.

ksize: A list of ints that has length >= 4. The size of the window for each dimension of the input tensor.

strides: A list of ints that has length >= 4. The stride of the sliding window for each dimension of the input tensor.

padding: A string, either ‘VALID’ or ‘SAME’. The padding algorithm.

name: Optional name for the operation.

Returns:

A Tensor with the same type as value. The max pooled output tensor.

初始化權重和偏置值矩陣，值是空的，需要後期訓練。

def weight_variable(shape):
    initial = tf.truncated_normal(shape, stddev=0.1)
    return tf.Variable(initial)

def bias_variable(shape):
    initial = tf.constant(0.1, shape = shape)
    # print(tf.Variable(initial).eval())
    return tf.Variable(initial)

#這是做了兩次卷積和池化
h_conv1 = tf.nn.relu(conv2d(x_image, w_conv1) + b_conv1)
h_pool1 = max_pool_2x2(h_conv1)

h_conv2 = tf.nn.relu(conv2d(h_pool1, w_conv2) + b_conv2)
h_pool2 = max_pool_2x2(h_conv2)

這裡是做了全連線，還用了relu啟用函式（RELU在下面會提到）
h_pool2_flat = tf.reshape(h_pool2, [-1, 7*7*64])
h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, w_fc1) + b_fc1)

#為了防止過擬合化，這裡用dropout來關閉一些連線（DROP下面會提到）
h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob)

然後得到的結果再跟之前的一樣，使用softmax等方法訓練即可得到引數。

RELU啟用函式

啟用函式有很多種，最常用的是以下三種

Sigmoid

將資料對映到0-1範圍內
#### 公式如下

####函式影象如下

Tanh

將資料對映到-1-1的範圍內

公式如下

函式影象如下

RELU

小於0的值就變成0，大於0的等於它本身

函式影象

dropout的作用

以前學習數學我們常用到一種方法，叫做待定係數法，就是給定2次函式上的幾個點，然後求得2次函式的引數。

一樣的道理，我們這裡用格式訓練集訓練，最後訓練得到引數，其實就是在求得一個模型（函式），使得它能跟原始資料的曲線進行擬合（說白了，就是假裝原始資料都在我們計算出來的函式上）

但是這樣不行啊，因為我們還需要對未知資料進行預測啊，如果原始的資料點都在（或者大多數都在）函式上了（這就是過擬合），那會被很多訓練資料誤導的，所以其實只要一個大致的趨勢函式就可以了

所以Dropout函式就是用來，減少某些點的全連線（可以理解為把一些點去掉了），來防止過擬合

程式碼

基於tensorflow的MNIST手寫數字識別（三）--神經網路篇

想想還是要說點什麼抱歉啊，第三篇姍姍來遲，確實是因為我懶，而不是忙什麼的，所以這次再加點料，以表示我的歉意。廢話不多說，我就直接開始講了。加入神經網路的意義前面也講到了，使用普通的訓練方法，也可以進行識別，但是識別的精度不夠高，

MNIST手寫數字識別（三）應用優化

本篇的主要內容應用三種優化方式，對之前的模型進行優化介紹一些在程式中用到的函式學習於《TensorFlow實戰Google深度學習框架》一書程式相比於第一次的簡單邏輯迴歸模型，這一次的調整了網路結構，添加了一個500個節點的隱藏層，在結構中，設定了

MachineLearning— (KNN)k Nearest Neighbor實現手寫數字識別（三）

本篇博文主要結合前兩篇的knn演算法理論部分knn理論理解（一）和knn理論理解（二），做一個KNN的實現，主要是根據《機器學習實戰》這本書的內容，一個非常經典有趣的例子就是使用knn最近鄰演算法來實現對手寫數字的識別，下面將給出Python程式碼，儘量使用詳盡的解

基於tensorflow的MNIST手寫數字識別（二）--入門篇

一、本文的意義因為谷歌官方其實已經寫了MNIST入門和深入兩篇教程了，那我寫這些文章又是為什麼呢，只是抄襲？那倒並不是，更準確的說應該是筆記吧，然後用更通俗的語言來解釋，並且補充

基於Keras mnist手寫數字識別---Keras卷積神經網路入門教程

目錄 1、一些說明 2、常量定義 3、工具函式 4、模型定義以及訓練 4.1、匯入庫 4.2、主入口 4.3、主函式 4.3.1、獲取訓練資料 4.3.1、定義模型 4.3.2

MNIST手寫數字識別（二）幾種模型優化方式介紹

本篇的主要內容有：動態衰減法設定可變學習率為損失函式新增正則項滑動平均模型介紹為了讓MNIST數字識別模型更準確，學習幾種常用的模型優化手段：學習率的優化學習率的設定一定程度上也會影響模型的訓練，如果學習率過小，那麼將會經過很長時間才會收斂到想要

手寫數字識別（一）

在學習識別手寫輸入數字時，初始化矩陣那裡，有點不理解。原始碼是這樣的：self.biases=[np.random.randn(y,1) for y in sizes[1:]] '''建立一個偏差向量''' self.weights=[np.random.ra

MNIST 手寫數字識別（一）

MNIST 手寫數字識別模型建立與優化本篇的主要內容有： TensorFlow 處理MNIST資料集的基本操作建立一個基礎的識別模型介紹 SoftmaxSoftmaxSoftmax迴歸以及交叉熵等 MNIST是一個很有名的手寫數字識別資料集（基本可以算

基於opencv的手寫數字識別（MFC,HOG,SVM）

因為本程式是提取HOG特徵，使用SVM進行分類的，所以大概瞭解下HOG的一些知識，其中我覺得怎麼計算影象HOG特徵的維度會對程式瞭解有幫助關於HOG，我們可以參考： http://gz-ricky.blogbus.com/logs/85326

MNIST資料集實現手寫數字識別（基於tensorflow）

主要應用了下面幾個方法來提高準確率; 使用隨機梯度下降（batch）使用Relu啟用函式去線性化使用正則化避免過擬合使用帶指數衰減的學習率使用滑動平均模型使用交叉熵損失函式來刻畫預測值和真實值之間的差距的損失函式第一步，匯入MNIST資料集 from

機器學習實戰例項之手寫數字識別（KNN、python3）

from numpy import * from os import listdir import operator def img2Vector(filename): returnVecter = zeros((1,1024)) fr = open(fil

機器學習--手寫數字識別（KNN、決策樹）

KNN 及決策樹演算法為監督學習中的兩種簡單演算法。 KNN KNN演算法（鄰近演算法）的核心思想是如果一個樣本在特徵空間中的k個最相鄰的樣本中的大多數屬於某一個類別，則該樣本也屬於這個類別，並具有這個類別上樣本的特性。歐式距離的計算公式: 假設每個樣本有兩個特徵值，如 A

手把手教你搭建caffe及手寫數字識別（Ubuntu下且附mac、純通俗教程）

手把手教你搭建caffe及手寫數字識別作者：七月線上課程助教團隊，驍哲、小蔡、李偉、July時間：二零一六年十一月九日交流：深度學習實戰交流Q群 472899334，有問題可以加此群共同交流。另探究實驗背後原理，請參看此課程：深度學習線上班。一、前言在前面的教程中，我

Matlab實現手寫數字識別（PCA+KNN）

</pre><pre name="code" class="plain">clear; addpath('../data/'); % images_train = loadMNISTImages('train-images-idx3-ubyte')'

TensorFlow MNIST資料集手寫數字識別（並解決MNIST資料集下載問題）

本篇部落格主要介紹通過TensorFlow實現MNIST資料集的手寫數字識別。準備資料：首先需要獲取資料，可以通過以下程式碼進行獲取：from tensorflow.examples.tutorials.mnist import input_data # 獲取資料,numbe

C++從零實現深度神經網路之六——實戰手寫數字識別（sigmoid和tanh）

本文由@星沉閣冰不語出品，轉載請註明作者和出處。之前的五篇部落格講述的內容應該覆蓋瞭如何編寫神經網路的大部分內容，在經過之前的一系列努力之後，終於可以開始實戰了。試試寫出來的神經網路怎麼樣吧。一、資料準

KNN演算法——實現手寫數字識別（Sklearn實現）

KNN專案實戰——手寫數字識別 1、資料集介紹需要識別的數字已經使用圖形處理軟體，處理成具有相同的色彩和大小：寬高是32畫素x32畫素的黑白影象。儘管採用本文格式儲存影象不能有效地利用記憶體空間，但是為了方便理解，我們將圖片轉換為文字格式。數字的文字格式如下：

pytorch綜合多個弱分類器，投票機制，進行手寫數字分類（boosting）

首先，這個文章的出發點就是讓一個網路一個圖片進行預測，在直觀上不如多個網路對一個圖片進行預測之後再少數服從多數效果好。也就是對於任何一個分類任務，訓練n個弱分類器，也就是分類準確度只比隨機猜好一點，那麼當n足夠大的時候，通過投票機制，也能提升很大的準確度：畢竟每個網路都分錯同一個資料的可能

吳恩達《神經網路與深度學習》課程筆記歸納（三）-- 神經網路基礎之Python與向量化

上節課我們主要介紹了邏輯迴歸，以輸出概率的形式來處理二分類問題。我們介紹了邏輯迴歸的Cost function表示式，並使用梯度下降演算法來計算最小化Cost function時對應的引數w和b。通過計算圖的方式來講述了神經網路的正向傳播和反向傳播兩個過程。本節課我們將來

Andrew Ng機器學習筆記+Weka相關演算法實現（三）神經網路和引數含義

神經網路是一種非常重要的機器學習模型，人們從生物學中大腦神經元連線方式得到啟發，提出了神經網路的概念，它從資訊處理角度對人腦神經元網路進行抽象，建立某種簡單模型，按不同的連線方式組成不同的網路。最近幾年深度學習大熱,尤其是阿爾法圍棋（AlphaGo）戰勝李

基於tensorflow的MNIST手寫數字識別（三）--神經網路篇

想想還是要說點什麼

加入神經網路的意義

流程和步驟

RELU啟用函式

Sigmoid

Tanh

公式如下

RELU

函式影象

dropout的作用

程式碼

相關推薦