Tensorflow實踐 mnist手寫數字識別

阿新 • • 發佈：2017-08-05

model 損失函數兩層最簡 sin test http gif bat

minst數據集　　

　　tensorflow的文檔中就自帶了mnist手寫數字識別的例子，是一個很經典也比較簡單的入門tensorflow的例子，非常值得自己動手親自實踐一下。由於我用的不是tensorflow中自帶的mnist數據集，而是從kaggle的網站下載下來的，數據集有些不太一樣，所以直接按照tensorflow官方文檔上的參數訓練的話還是踩了一些坑，特此記錄。

　　首先從kaggle網站下載mnist數據集，一份是train.csv,用於訓練，另一份是test.csv 用於測試提交的。

1 import 
 pandas as pd
2 import numpy as np
3 
4 train = pd.read_csv("train.csv")
5 test = pd.read_csv("test.csv")

技術分享

表中的每一行代表一張圖片，label代表這張圖片的數字，其他列是每個像素點的值，不是0就是1，每張圖有 28 * 28 = 784 個像素點。

由於輸出的時候用的是softmax，所以要先對label進行one-hot encode.

all_x = np.array(train_data.iloc[:,1:],dtype=np.float32)
all_y = np.array(train_data.iloc[:,0])
 
from sklearn.preprocessing import OneHotEncoder
enc = OneHotEncoder()
all_y_onehot = enc.fit_transform(all_y.reshape(-1,1)).toarray()

技術分享

最後為了不用提交能測試模型的效果，將train_data 拆分成用於訓練和用於測試兩部分。

from sklearn.model_selection import train_test_split
train_x,test_x,train_y,test_y = train_test_split(all_x,all_y_onehot,test_size=0.1,random_state=0)

感知機模型

　　先從最簡單的神經網絡模型出發，設計一個只有兩層的神經網絡，網絡的輸入是 784 維的，輸出是10維的。大致可以分成兩步：1. 設計網絡結構 2. 設置優化方法

import tensorflow as tf

sess = tf.InteractiveSession()

x = tf.placeholder("float",shape=[None,784])
y_ = tf.placeholder("float",shape=[None,10])

W = tf.Variable(tf.zeros((784,10)))
b = tf.Variable(tf.zeros((10,)))
y = tf.nn.softmax(tf.matmul(x, W) + b)

cross_entropy = -tf.reduce_sum(y_*tf.log(y))
train_step = tf.train.GradientDescentOptimizer(1e-2).minimize(cross_entropy)

sess.run(tf.global_variables_initializer())

然後就可以開始訓練了

train_size = train_x.shape[0]
for i in range(1000):
    start = i*50 % train_size
    end = (i+1)*50 % train_size
    #print(start,end)
    #print(b.eval())
    if start > end:
        start = 0
    batch_x = train_x[start:end]
    batch_y = train_y[start:end]
    print(cross_entropy.eval(feed_dict={x:batch_x,y_:batch_y}))
    sess.run(train_step,feed_dict={x:batch_x,y_:batch_y})

為了查看模型的收斂情況，我把訓練過程中的cross_entropy也打印出來了，但是發生了不幸的情況。

技術分享

額，第一次叠代完之後交叉熵就變成nan了，可以同時把 b 和 y 的值也打印出來，發現應該是因為步長太大了，所以將步長調小，我將步長調為了1e-7。

技術分享

嗯，輸出就變正常啦~ 再看一下這個模型的效果。

技術分享

在測試集上達到了90%的準確率，嗯，還不錯，但是應該可以更好，畢竟kaggle上面的最高準確率都到100%了==，所以接著嘗試用更復雜一些的卷積神經網絡。

卷積神經網絡

def weight_variable(shape):
    initial = tf.truncated_normal(shape, stddev=0.0001)
    return tf.Variable(initial)

def bias_variable(shape):
    initial = tf.constant(0.1, shape=shape)
    return tf.Variable(initial)

def conv2d(x, W):
    return tf.nn.conv2d(x,W,strides=[1,1,1,1],padding=‘SAME‘)

def max_pool_2x2(x):
    return tf.nn.max_pool(x, ksize=[1,2,2,1],
                         strides=[1,2,2,1],
                         padding=‘SAME‘)

#因為要進行卷積操作，所以要將圖片reshape成28*28*1的形狀。
x_image = tf.reshape(x,[-1,28,28,1])

開始設計網絡

#第一層卷積層 + relu正則函數 + 池化層
W_conv1 = weight_variable([5,5,1,32])
b_conv1 = bias_variable([32])

h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1)
h_pool1 = max_pool_2x2(h_conv1)

#第二層卷積層 + relu正則函數 + 池化層
W_conv2 = weight_variable([5,5,32,64])
b_conv2 = bias_variable([64])

h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2) + b_conv2)
h_pool2 = max_pool_2x2(h_conv2)


#第一個全連接層 + relu正則函數 + 隨機失活
W_fc1 = weight_variable([7*7*64, 1024])
b_fc1 = bias_variable([1024])

h_pool2_flat = tf.reshape(h_pool2,[-1,7*7*64])
h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, W_fc1) + b_fc1)

keep_prob = tf.placeholder("float")
h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob)

#第二個全連接層 + softmax輸出
W_fc2 = weight_variable([1024,10])
b_fc2 = bias_variable([10])
y_conv = tf.nn.softmax(tf.matmul(h_fc1_drop, W_fc2) + b_fc2)

設置優化方法

cross_entropy = -tf.reduce_sum(y_*tf.log(y_conv))
train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)
correct_prediction = tf.equal(tf.argmax(y_conv,1),tf.argmax(y_,1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction,"float"))
sess.run(tf.global_variables_initializer())

然後就可以開始訓練啦

train_size = train_x.shape[0]
for i in range(1000):
    start = i*50 % train_size
    end = (i+1)*50 % train_size
    if start > end:
        start = 0
    batch_x = train_x[start:end]
    batch_y = train_y[start:end]
    if i%20 == 0:
        print("iter {} : the accuracy is {:.2f}".format(i,accuracy.eval(feed_dict={x:batch_x,y_:batch_y,keep_prob:1.0})),
        ", the cross_entropy is {:.2f}".format(cross_entropy.eval(feed_dict={x:batch_x,y_:batch_y,keep_prob:1.0})))
    sess.run(train_step,feed_dict={x:batch_x,y_:batch_y,keep_prob:0.5})

看一下輸出的結果

技術分享

最後準確率停留在0.95左右，但是訓練開始的時候交叉熵變化不大，收斂比較慢，所以可以嘗試將步長設大一些，於是將步長改為1e-3

技術分享

嗯，準確率提升到了98%，還是不錯的。這樣模型就訓練好了，在測試集上預測一下結果並將結果上傳到kaggle。

test_x = np.array(test_data,dtype=np.float32)
test_pred_y = y_conv.eval(feed_dict={x:test_x,keep_prob:1.0})
test_pred = np.argmax(test_pred_y,axis=1)

技術分享

在測試集上的準確率也是98%左右，排名906，差不多是50%的位置，作為一個開始還是不錯的^^.

總結

一，用tensorflow的三大步驟：1、設計網絡結構　　2、設置優化方法　　3、叠代進行訓練

二，訓練過程中觀察損失函數的輸出，如果一下子變成nan，可能是優化時的步長太大了，如果多次叠代沒有變化的話可能是步長太小了。

三，多動手，畢竟就算是文檔中的例子，自己運行的時候也不知道會發生什麽[捂臉]

Tensorflow實踐 mnist手寫數字識別

model 損失函數兩層最簡 sin test http gif bat minst數據集　　　　tensorflow的文檔中就自帶了mnist手寫數字識別的例子，是一個很經典也比較簡單

Tensorflow之MNIST手寫數字識別：分類問題（1）

一、MNIST資料集讀取 one hot 獨熱編碼獨熱編碼是一種稀疏向量，其中：一個向量設為1，其他元素均設為0.獨熱編碼常用於表示擁有有限個可能值的字串或識別符號優點： 1、將離散特徵的取值擴充套件到了歐式空間，離散特徵的某個取值就對應歐式空間的某個點　　　　2、機器學習演算法中，

Tensorflow之MNIST手寫數字識別：分類問題（2）

整體程式碼： #資料讀取 import tensorflow as tf import matplotlib.pyplot as plt import numpy as np from tensorflow.examples.tutorials.mnist import input_data mnis

基於tensorflow的MNIST手寫數字識別（二）--入門篇

一、本文的意義因為谷歌官方其實已經寫了MNIST入門和深入兩篇教程了，那我寫這些文章又是為什麼呢，只是抄襲？那倒並不是，更準確的說應該是筆記吧，然後用更通俗的語言來解釋，並且補充

Android+TensorFlow+CNN+MNIST 手寫數字識別實現

SkySeraph 2018 Overview 本文系“SkySeraph AI 實踐到理論系列”第一篇，咱以AI界的HelloWord 經典MNIST資料集為基礎，在Android平臺，基於TensorFlow，實現CNN的手寫數字識別。Code here~ Practice Env

基於tensorflow的MNIST手寫數字識別（三）--神經網路篇

想想還是要說點什麼抱歉啊，第三篇姍姍來遲，確實是因為我懶，而不是忙什麼的，所以這次再加點料，以表示我的歉意。廢話不多說，我就直接開始講了。加入神經網路的意義前面也講到了，使用普通的訓練方法，也可以進行識別，但是識別的精度不夠高，

tensorflow 基礎學習五：MNIST手寫數字識別

truncate averages val flow one die correct 表示 data MNIST數據集介紹： from tensorflow.examples.tutorials.mnist import input_data # 載入MNIST數據集，

TensorFlow筆記（1）非線性迴歸、MNIST手寫數字識別

程式 import tensorflow as tf import numpy as np import matplotlib.pyplot as plt # numpy生成200個隨機點，下面這麼寫可以得到200行1列的矩陣 x_data = np.linspace(-0.5,

tensorflow實戰：MNIST手寫數字識別的優化2-代價函式優化，準確率98%

最簡單的tensorflow的手寫識別模型，這一節我們將會介紹其簡單的優化模型。我們會從代價函式，多層感知器，防止過擬合，以及優化器的等幾個方面來介紹優化過程。 1.代價函式的優化：我們可以這樣將代價函式理解為真實值與預測值的差距，我們神經

Tensorflow案例5：CNN演算法-Mnist手寫數字識別

學習目標目標應用tf.nn.conv2d實現卷積計算應用tf.nn.relu實現啟用函式計算應用tf.nn.max_pool實現池化層的計算應用卷積神經網路實現影象分類識別應用

Tensorflow案例4：Mnist手寫數字識別(線性神經網路)及其侷限性

學習目標目標應用matmul實現全連線層的計算說明準確率的計算應用softmax_cross_entropy_with_logits實現softamx以及交叉熵損失計算說明全連線層在神經網路的作用應用全連

TensorFlow——MNIST手寫數字識別

import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data #載入資料集 mnist=input_data.read_data_sets('MNIST_data',one_hot=True) #

TensorFlow——Mnist手寫數字識別並可視化實戰教程（一）

要點：該教程為深度學習tensorflow框架mnist手寫數字識別。實戰教程分為（一）（二）（三）分別從tensorflow和MATLAB雙角度來實現。筆者資訊：Next_Legend Q

TensorFlow程式碼實現（一）[MNIST手寫數字識別]

最簡單的神經網路結構：資料來源準備：資料在之前的文章中分析過了在這裡我們就構造一層神經網路：前提準備：引數： train images：因為圖片是28*28的個數，換算成一維陣列就是784，因此我們定義x = tf.placeholder(tf

TensorFlow實現機器學習的“Hello World”--Mnist手寫數字識別

TensorFlow實現機器學習的“Hello World” 上一篇部落格我們已經說了TensorFlow大概怎麼使用，這次來說說機器學習中特別經典的案例，也相當於是機器學習的“Hello World”，他就是Mnist手寫數字識別，也就是通過訓練機器讓他能看

TensorFlow筆記之一：MNIST手寫數字識別

本人剛剛開始接觸深度學習不久，對於tensorflow的瞭解也有限，想通過tensorflow這個框架來學習深度學習及其優化與識別。現在直接進入主題。 1.手寫識別的介紹： MNIST手寫識別在機器學習中就像c語言中Hello Wor

Tensorflow深度學習之七：再談mnist手寫數字識別程式

之前學習的第一個深度學習的程式就是mnist手寫字型的識別，那個時候對於很多概念不是很理解，現在回過頭再看當時的程式碼，理解了很多，現將加了註釋的程式碼貼上，與大家分享。（本人還是在學習Tensorflow的初始階段，如果有什麼地方理解有誤，還請大家不吝指出。）

Mnist手寫數字識別 Tensorflow

# Ｍnist手寫數字識別 Tensorflow ## 任務目標 * 瞭解mnist資料集 * 搭建和測試模型 *** ## 編輯環境作業系統:Win10 python版本:3.6 整合開發環境:pycharm tensorflow版本:1.* *** ## 程式流程圖 ![程式流程圖](https://i

mnist手寫數字識別——深度學習入門專案（tensorflow+keras+Sequential模型）

前言今天記錄一下深度學習的另外一個入門專案——《mnist資料集手寫數字識別》，這是一個入門必備的學習案例，主要使用了tensorflow下的keras網路結構的Sequential模型，常用層的Dense全連線層、Activation啟用層和Reshape層。還有其他方法訓練手寫數

Caffe的運行mnist手寫數字識別

而不是所在結果 ack cif sting one efi 打開老規矩，首先附上官方教程：http://caffe.berkeleyvision.org/gathered/examples/mnist.html 1、必要軟件　　因為Caffe中使用的是Linux才能

Tensorflow實踐 mnist手寫數字識別

相關推薦