keras實現mnist資料集手寫數字識別

阿新 • • 發佈：2019-02-12

經過幾天的爬坑，“東搞西搞”終於把深度學習的“HELLO,WORLD”做出來了，以下是自己的實戰過程：

關於keras識別手寫數字的入門準備：

2.Mnist資料集的準備

3.匯入資料集測試

4.實現baseline模型：

5.實現簡單的卷積神經網路

一. Tensorflow環境的安裝

這裡我們只講CPU版本，使用 Anaconda 進行安裝

a.首先我們要安裝 Anaconda

連結：https://pan.baidu.com/s/1AxdGi93oN9kXCLdyxOMnRA 密碼：79ig

過程如下：

第一步：點選next

第二步：I Agree

第三步：Just ME

第四步：自己選擇一個恰當位置放它就好

第五步：建議只選擇第二個

第六步：就直接install啦啦啦啦，然後你就可以上手萬能庫了

b.找到Anaconda prompt，然後

以管理員的身份開啟終端

c.按照以下步驟在 Anaconda 環境中安裝 TensorFlow：

通過呼叫以下命令建立名為 tensorflow 的 conda 環境：

C:> conda create -n tensorflow pip python=3.5

通過發出以下命令啟用 conda 環境：

C:> activate tensorflow (tensorflow)C:> # Your prompt should change

發出相應命令以在 conda 環境中安裝 TensorFlow。要安裝僅支援 CPU 的 TensorFlow 版本，請輸入以下命令：

(tensorflow)C:> pip install --ignore-installed --upgrade tensorflow

d.測試tensorflow的安裝

啟動Anaconda prompt（同樣是以管理員身份開啟）終端。

如果您是通過 Anaconda 進行安裝，請啟用您的 Anaconda 環境。

終端輸入 activate tensorflow即可

然後再輸入python

如：

在 Python 互動式 shell 中輸入以下幾行簡短的程式程式碼：

>>> import tensorflow as tf

>>> hello = tf.constant('Hello, TensorFlow!')

>>> sess = tf.Session()

>>> print(sess.run(hello))

如果系統輸出以下內容，說明您可以開始編寫 TensorFlow 程式了：

Hello, TensorFlow!

完成以上步驟，你就把tensorflow搭建好了......

二.安裝keras

a.首先，擔心我們anaconda裡面各個包未更新到最新，所以我們以管理員的身份開啟Anaconda終端，輸入 conda update conda,執行完後，再輸入：conda update --all

b.然後我們啟用我們的tensorflow環境：activate tensorflow

c.然後我們就可以輸入：pip install keras

三.完成上述步驟，我們就可以來試下載入keras裡面的mnist資料集了

# Plot ad hoc mnist instances
from keras.datasets import mnist
import matplotlib.pyplot as plt
# load (downloaded if needed) the MNIST dataset
(X_train, y_train), (X_test, y_test) = mnist.load_data()
# plot 4 images as gray scale
plt.subplot(221)
plt.imshow(X_train[0], cmap=plt.get_cmap('gray'))
plt.subplot(222)
plt.imshow(X_train[1], cmap=plt.get_cmap('gray'))
plt.subplot(223)
plt.imshow(X_train[2], cmap=plt.get_cmap('gray'))
plt.subplot(224)
plt.imshow(X_train[3], cmap=plt.get_cmap('gray'))
# show the plot
plt.show()

上面的程式碼載入了資料集並畫出了前4個圖片：
這裡寫圖片描述

好了接下來我們對上述程式碼進行進一步的解釋：

from keras.datasets import mnist 這裡是從keras的datasets中匯入mnist資料集
import matplotlib.pyplot as plt  這裡是將matplotlib.pyplot重名為plt
(X_train, y_train), (X_test, y_test) = mnist.load_data()#
所以這裡返回的是手寫圖片的兩個tuple，第一個tuple儲存的是我們已經人工分類好的圖片，也就是每一張圖片都有自己對應的標籤，然後可以拿來訓練，第二個tuple儲存的是我們還沒分類的圖片，在第一個tuple訓練完後，我們可以把第二個tuple利用神經網路進行分類，根據實驗結果的真實值與我們的預測值進行對比得到相應的損失值，再利用反向傳播進行引數更新，再進行分類，然後重複前述步驟直至損失值最小
# plot 4 images as gray scale
plt.subplot(331)
這個subplot函式的作用是確定影象的位置以及影象的個數，前兩個3的意思是可以放9張圖片，如果變成221的話，就是可以放4張圖片，然後後面的1，是確定影象的位置，處於第一個，以下的subplot同理
plt.imshow(X_test[0], cmap=plt.get_cmap('gray'))
這裡個把圖片顯示出來
X_train儲存的是影象的畫素點組成的list資料型別，這裡面又由一個二維的list（28 x 28的畫素點值）和一個對應的標籤list組成，y_train儲存的是對應影象的標籤，也就是該影象代表什麼數字
plt.subplot(332)
plt.imshow(X_train[1], cmap=plt.get_cmap('gray'))
plt.subplot(333)
plt.imshow(X_train[2], cmap=plt.get_cmap('gray'))
plt.subplot(334)
plt.imshow(X_train[3], cmap=plt.get_cmap('gray'))
plt.subplot(335)
plt.imshow(X_train[4], cmap=plt.get_cmap('gray'))
plt.subplot(336)
plt.imshow(X_train[5], cmap=plt.get_cmap('gray'))
plt.subplot(337)
plt.imshow(X_train[6], cmap=plt.get_cmap('gray'))
plt.subplot(338)
plt.imshow(X_train[7], cmap=plt.get_cmap('gray'))
plt.subplot(339)
plt.imshow(X_train[8], cmap=plt.get_cmap('gray'))
在這裡imshow函式的官方文件：https://matplotlib.org/api/_as_gen/matplotlib.pyplot.imshow.html#matplotlib.pyplot.imshow
我們這裡第一個引數是圖片的畫素點值組成的陣列（列表），第二個引數是指明圖片的色彩
# show the plot
plt.show()最後這裡官方文件是這樣說的：Display a figure. When running in ipython with its pylab mode, display all figures and return to the ipython prompt.，所以我們可以知道show函式是把所有圖片都展示出來。

上述程式碼展示的結果是：

多層感知機的baseline模型

在實現卷積神經網路這種複雜的模型之前，先實現一個簡單但效果也不錯的模型：多層感知機。這種模型也叫含隱層的神經網路。模型的效果可以使錯誤率達到1.87%。

import numpy   #匯入資料庫
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Dropout
from keras.utils import np_utils

seed = 7   #設定隨機種子
numpy.random.seed(seed)

(X_train, y_train), (X_test, y_test) = mnist.load_data() #載入資料

num_pixels = X_train.shape[1] * X_train.shape[2]
X_train = X_train.reshape(X_train.shape[0], num_pixels).astype('float32')
X_test = X_test.reshape(X_test.shape[0], num_pixels).astype('float32')
#資料集是3維的向量（instance length,width,height).對於多層感知機，模型的輸入是二維的向量，因此這
#裡需要將資料集reshape，即將28*28的向量轉成784長度的陣列。可以用numpy的reshape函式輕鬆實現這個過
#程。

#給定的畫素的灰度值在0-255，為了使模型的訓練效果更好，通常將數值歸一化對映到0-1。
X_train = X_train / 255
X_test = X_test / 255

#最後，模型的輸出是對每個類別的打分預測，對於分類結果從0-9的每個類別都有一個預測分值，表示將模型
#輸入預測為該類的概率大小，概率越大可信度越高。由於原始的資料標籤是0-9的整數值，通常將其表示成#0ne-hot向量。如第一個訓練資料的標籤為5，one-hot表示為[0,0,0,0,0,1,0,0,0,0]。

y_train = np_utils.to_categorical(y_train)
y_test = np_utils.to_categorical(y_test)
num_classes = y_test.shape[1]

#現在需要做得就是搭建神經網路模型了，建立一個函式，建立含有一個隱層的神經網路。
# define baseline model
def baseline_model():
    # create model
    model = Sequential()
    model.add(Dense(num_pixels, input_dim=num_pixels, kernel_initializer='normal', activation='relu'))
    model.add(Dense(num_classes, kernel_initializer='normal', activation='softmax'))
    # Compile model
    model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
    return model

#型的隱含層含有784個節點，接受的輸入長度也是784（28*28），最後用softmax函式將預測結果轉換為標籤
#的概率值。 
#將訓練資料fit到模型，設定了迭代輪數，每輪200個訓練樣本，將測試集作為驗證集，並檢視訓練的效果。

# build the model
model = baseline_model()
# Fit the model
model.fit(X_train, y_train, validation_data=(X_test, y_test), epochs=10, batch_size=200, verbose=2)
# Final evaluation of the model
scores = model.evaluate(X_test, y_test, verbose=0)
print("Baseline Error: %.2f%%" % (100-scores[1]*100))

訓練和測試結果如下：

Train on 60000 samples, validate on 10000 samples 
Epoch 1/10 
6s - loss: 0.2789 - acc: 0.9210 - val_loss: 0.1416 - val_acc: 0.9578 
Epoch 2/10 
5s - loss: 0.1117 - acc: 0.9677 - val_loss: 0.0917 - val_acc: 0.9707 
Epoch 3/10 
5s - loss: 0.0717 - acc: 0.9796 - val_loss: 0.0787 - val_acc: 0.9767 
Epoch 4/10 
6s - loss: 0.0502 - acc: 0.9859 - val_loss: 0.0741 - val_acc: 0.9767 
Epoch 5/10 
5s - loss: 0.0372 - acc: 0.9890 - val_loss: 0.0681 - val_acc: 0.9788 
Epoch 6/10 
5s - loss: 0.0269 - acc: 0.9925 - val_loss: 0.0625 - val_acc: 0.9808 
Epoch 7/10 
5s - loss: 0.0208 - acc: 0.9948 - val_loss: 0.0619 - val_acc: 0.9814 
Epoch 8/10 
6s - loss: 0.0140 - acc: 0.9970 - val_loss: 0.0639 - val_acc: 0.9799 
Epoch 9/10 
5s - loss: 0.0108 - acc: 0.9978 - val_loss: 0.0597 - val_acc: 0.9812 
Epoch 10/10 
5s - loss: 0.0080 - acc: 0.9985 - val_loss: 0.0591 - val_acc: 0.9813 
Baseline Error: 1.87%

簡單的卷積神經網路

前面介紹瞭如何載入訓練資料並實現一個簡單的單隱層神經網路，並在測試集上取得了不錯的效果。現在要實現一個卷積神經網路，想要在MNIST問題上取得更好的效果。

卷積神經網路（CNN）是一種深度神經網路，與單隱層的神經網路不同的是它還包含卷積層、池化層、Dropout層等，這使得它在影象分類的問題上有更優的效果。詳細的CNN教程可以參見斯坦福大學的cs231n課程講義，中文版連結

第一步依然是匯入需要的函式庫

import numpy
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Dropout
from keras.layers import Flatten
from keras.layers.convolutional import Conv2D
from keras.layers.convolutional import MaxPooling2D
from keras.utils import np_utils
from keras import backend as K
K.set_image_dim_ordering('th')

設定隨機數種子

seed = 7
numpy.random.seed(seed)

將資料reshape，CNN的輸入是4維的張量（可看做多維的向量），第一維是樣本規模，第二維是畫素通道，第三維和第四維是長度和寬度。並將數值歸一化和類別標籤向量化。

# load data
(X_train, y_train), (X_test, y_test) = mnist.load_data()
# reshape to be [samples][pixels][width][height]
X_train = X_train.reshape(X_train.shape[0], 1, 28, 28).astype('float32')
X_test = X_test.reshape(X_test.shape[0], 1, 28, 28).astype('float32')

X_train = X_train / 255
X_test = X_test / 255
# one hot encode outputs
y_train = np_utils.to_categorical(y_train)
y_test = np_utils.to_categorical(y_test)
num_classes = y_test.shape[1]

接下來構造CNN。

第一層是卷積層。該層有32個feature map,或者叫濾波器，作為模型的輸入層，接受[pixels][width][height]大小的輸入資料。feature map的大小是5*5，其輸出接一個‘relu’啟用函式。
下一層是pooling層，使用了MaxPooling，大小為2*2。
下一層是Dropout層，該層的作用相當於對引數進行正則化來防止模型過擬合。
接下來是全連線層，有128個神經元，啟用函式採用‘relu’。
最後一層是輸出層，有10個神經元，每個神經元對應一個類別，輸出值表示樣本屬於該類別的概率大小。

def baseline_model():
    # create model
    model = Sequential()
    model.add(Conv2D(32, (5, 5), input_shape=(1, 28, 28), activation='relu'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.2))
    model.add(Flatten())
    model.add(Dense(128, activation='relu'))
    model.add(Dense(num_classes, activation='softmax'))
    # Compile model
    model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])
    return model

接著開始訓練模型

# build the model
model = baseline_model()
# Fit the model
model.fit(X_train, y_train, validation_data=(X_test, y_test), epochs=10, batch_size=200, verbose=2)
# Final evaluation of the model
scores = model.evaluate(X_test, y_test, verbose=0)
print("Baseline Error: %.2f%%" % (100-scores[1]*100))

訓練和測試結果如下：

Train on 60000 samples, validate on 10000 samples
Epoch 1/10
137s - loss: 0.2329 - acc: 0.9340 - val_loss: 0.0820 - val_acc: 0.9742
Epoch 2/10
140s - loss: 0.0736 - acc: 0.9781 - val_loss: 0.0466 - val_acc: 0.9842
Epoch 3/10
138s - loss: 0.0531 - acc: 0.9839 - val_loss: 0.0432 - val_acc: 0.9860
Epoch 4/10
145s - loss: 0.0404 - acc: 0.9876 - val_loss: 0.0389 - val_acc: 0.9872
Epoch 5/10
135s - loss: 0.0335 - acc: 0.9893 - val_loss: 0.0341 - val_acc: 0.9886
Epoch 6/10
133s - loss: 0.0275 - acc: 0.9915 - val_loss: 0.0308 - val_acc: 0.9893
Epoch 7/10
133s - loss: 0.0233 - acc: 0.9926 - val_loss: 0.0363 - val_acc: 0.9880
Epoch 8/10
137s - loss: 0.0204 - acc: 0.9937 - val_loss: 0.0320 - val_acc: 0.9889
Epoch 9/10
139s - loss: 0.0167 - acc: 0.9945 - val_loss: 0.0294 - val_acc: 0.9893
Epoch 10/10
139s - loss: 0.0143 - acc: 0.9957 - val_loss: 0.0310 - val_acc: 0.9907
Baseline Error: 0.93%

可以看出相對於單隱層神經網路，CNN的效果有很大提升，error rate 從1.87%降到了0.93%。

上面實現了一個只含有一層卷積層和pooling層的CNN，為了實現更好的分類效果，可以新增多層的Convolution2D和MaxPooling2D，CNN會自動提取特徵，學習到更好的分類效果。

keras實現mnist資料集手寫數字識別

經過幾天的爬坑，“東搞西搞”終於把深度學習的“HELLO,WORLD”做出來了，以下是自己的實戰過程：關於keras識別手寫數字的入門準備： 2.Mnist資料集的準備 3.匯入資料集測試 4.實現baseline模型： 5.實現簡單的卷積神經網路一.

Tensorflow1.8用keras實現MNIST資料集手寫字型識別例程

import tensorflow as tf tf.enable_eager_execution() eager是新版本加入的動態圖，可以直接計算出結果而不用使用Session。同時也支援微分操作。 class DataLoader(): def __init_

Tensorflow1.8用keras實現MNIST資料集手寫字型識別例程（二）

class CNN(tf.keras.Model): def __init__(self): super().__init__() self.conv1 = tf.keras.layers.Conv2D( f

TensorFlow MNIST資料集手寫數字識別（並解決MNIST資料集下載問題）

本篇部落格主要介紹通過TensorFlow實現MNIST資料集的手寫數字識別。準備資料：首先需要獲取資料，可以通過以下程式碼進行獲取：from tensorflow.examples.tutorials.mnist import input_data # 獲取資料,numbe

用keras訓練mnist資料集手寫識別

%matplotlib inline import pickle import os import keras, theano from keras.models import Sequential from keras.layers import Dense, Dropout, Flatten # ker

吳裕雄 python 神經網絡——TensorFlow實現AlexNet模型處理手寫數字識別MNIST數據集

its iter style 輸出 init 向量數字 ict sha import tensorflow as tf # 輸入數據 from tensorflow.examples.tutorials.mnist import input_data m

caffe的python接口學習（4）mnist實例手寫數字識別

數字 interval with lac EDA 變化 mode 指數 lB 以下主要是摘抄denny博文的內容，更多內容大家去看原作者吧　　一數據準備　　準備訓練集和測試集圖片的列表清單; 　　二導入caffe庫，設定文件路徑　　 # -*- coding: u

【人工智慧】利用C語言實現KNN演算法進行手寫數字識別

KNN演算法稱為鄰近演算法，或者說K最近鄰(kNN，k-NearestNeighbor)分類演算法。所謂K最近鄰，就是k個最近的鄰居的意思，說的是每個樣本都可以用它最接近的k個鄰居來代表。kNN演算法的核心思想是如果一個樣本在特徵空間中的k個最相鄰的樣本中的大多數屬於某一個類

【深度學習】3：BP神經網路與MNIST資料集實現手寫數字識別

前言：這是一篇基於tensorflow框架，建立的只有一層隱藏層的BP神經網路，做的圖片識別，內容也比較簡單，全當是自己的學習筆記了。 –—-—-—-—-—-—-—-—-—-—-—-—–—-—-—-—-—-—-—-——-—-—-—-—-—-—-—-—-—-—-

MNIST資料集實現手寫數字識別（基於tensorflow）

主要應用了下面幾個方法來提高準確率; 使用隨機梯度下降（batch）使用Relu啟用函式去線性化使用正則化避免過擬合使用帶指數衰減的學習率使用滑動平均模型使用交叉熵損失函式來刻畫預測值和真實值之間的差距的損失函式第一步，匯入MNIST資料集 from

使用mnist資料集實現手寫數字識別

mnist資料集中數字是0到9，要求實現多分類，需要使用softmax函式。此次實現單隱層神經網路即只有一個輸入層和一個輸出層的神經網路來訓練並實現手寫數字識別。 softmax只作用在輸出層，要求輸出層輸出一個1*10維的向量，向量中每一個元素的位置代表相應的

TensorFlow筆記（3）——利用TensorFlow和MNIST資料集訓練一個最簡單的手寫數字識別模型

前言當我們開始學習程式設計的時候，第一件事往往是學習列印"Hello World"。就好比程式設計入門有Hello World，機器學習入門有MNIST。 MNIST是一個入門級的計算機視覺資料集，它包含各種手寫數字圖片：它也包含每一張圖片對應的標籤，告訴我們這個是數字幾。比如，上

全連線網路基礎-MNIST資料集輸出手寫數字識別準確率

本節目標：搭建神經網路，在 mnist 資料集上訓練模型，輸出手寫數字識別準確率。 ——————————————————————————————————————————————不可視的境界線 mnist 資料集：包含 7 萬張黑底白字手寫數字圖片，其中 55000 張為訓

lesson22-24 MNIST資料集，模組化搭建神經網路八股，手寫數字識別準確率輸出

import tensorflow as tf #MNIST資料集輸出識別準確率 #MNIST資料集： #提供6w張28*28畫素點的0-9手寫數字圖片和標籤，用於訓練 #提供1w張28*28畫素點的0-9手寫數字圖片和標籤，用於測試 #每張圖片的784個畫素點（

TensorFlow筆記（3）——利用TensorFlow和MNIST資料集訓練一個最簡單的手寫數字識別模型...

前言當我們開始學習程式設計的時候，第一件事往往是學習列印"Hello World"。就好比程式設計入門有Hello World，機器學習入門有MNIST。 MNIST是一個入門級的計算機視覺資料集，它包含各種手寫數字圖片：

基於Tensorflow, OpenCV. 使用MNIST資料集訓練卷積神經網路模型，用於手寫數字識別

基於Tensorflow，OpenCV 使用MNIST資料集訓練卷積神經網路模型，用於手寫數字識別一個單層的神經網路，使用MNIST訓練，識別準確率較低兩層的卷積神經網路，使用MNIST訓練（模型使用MNIST測試集準確率高於99%

MFC基於對話框手寫數字識別 SVM+MNIST數據集

識別數字做了 XML svm 簡單實用清空朋友 detail data 完整項目下載地址： http://download.csdn.net/detail/hi_dahaihai/9892004 本項目即拿MFC做了一個畫板，畫一個數字後可自行識別數字。此外還有保存

基於Keras mnist手寫數字識別---Keras卷積神經網路入門教程

目錄 1、一些說明 2、常量定義 3、工具函式 4、模型定義以及訓練 4.1、匯入庫 4.2、主入口 4.3、主函式 4.3.1、獲取訓練資料 4.3.1、定義模型 4.3.2

神經網路實現Mnist手寫數字識別筆記

目錄 1.Mnist手寫數字識別介紹 Mnist手寫數字識別是Kaggle上一個很經典的機器學習資料集，裡邊包括55000張訓練資料和10000張圖片的測試資料，每張圖片大小為28*28畫素的單通圖片。該任務為通過機器學習來識別圖片中的

CNN實現MNIST手寫數字識別

關鍵詞：CNN、TensorFlow、卷積、池化、特徵圖一. 前言本文用TensorFlow實現了CNN(卷積神經網路)的經典結構LeNet-5, 具體CNN的LeNet-5模型原理見《深度學習（四）卷積神經網路入門學習(1)》，講得還是比較清楚的。

keras實現mnist資料集手寫數字識別

多層感知機的baseline模型

簡單的卷積神經網路

相關推薦