1. 程式人生 > >使用mnist資料集實現手寫數字識別

使用mnist資料集實現手寫數字識別

    mnist資料集中數字是0到9,要求實現多分類,需要使用softmax函式。此次實現單隱層神經網路即只有一個輸入層和一個輸出層的神經網路來訓練並實現手寫數字識別。

    softmax只作用在輸出層,要求輸出層輸出一個1*10維的向量,向量中每一個元素的位置代表相應的0到9數字,而元素值代表是該數字的概率。

    實現手寫數字識別分為兩步,第一步是建立神經網路模型,第二步是執行該模型。

    mnist中圖片是28*28維的,展開來就是784個特徵值,mnist.train.images()得到的是60000*784維的向量,由於使用隨機梯度下降來實現反向傳播,所以需要將每一次迴歸的輸入向量是None*784維的向量,而引數w和b,使用0來初始化。每一次的迴歸運算都會得到更新過後的引數,在進行了N次迴歸即N次訓練之後,得到了最新的引數,再根據最新的引數來輸入測試集的所有資料來進行測試並計算正確率。

from tensorflow.examples.tutorials.mnist import input_data
mnist=input_data.read_data_sets('./MNIST_data/',one_hot=True)
import tensorflow as tf
X=tf.placeholder("float",[None,784])
W=tf.Variable(tf.zeros([784,10]))
b=tf.Variable(tf.zeros([10]))
y_hat=tf.nn.softmax(tf.matmul(X,W)+b)
y=tf.placeholder("float",[None,10])
loss=-tf.reduce_sum(y*tf.log(y_hat))
train=tf.train.GradientDescentOptimizer(0.01).minimize(loss)
init=tf.initialize_all_variables()
session=tf.Session()
session.run(init)
for i in range(1000):
    batch_xs,batch_ys=mnist.train.next_batch(100)
    session.run(train,feed_dict={X:batch_xs,y:batch_ys})
prediction=tf.equal(tf.argmax(y,1),tf.argmax(y_hat,1))
accuracy=tf.reduce_mean(tf.cast(prediction,"float"))
print(session.run(accuracy,feed_dict={X:mnist.test.images,y:mnist.test.labels}))
    其中,用於代表將資料集喂入神經網路的變數使用placeholder來進行佔位,而需要被訓練的引數使用Variable可變張量來初始化,
inti=tf.initialize_all_variables()
session=tf.Session()
session.run(init)
    上面這段程式碼的意思是tensorflow必須的,因為tensorflow是用計算圖來運算的,需要一個源op,tensorflow有一個預設源op,tf.Session()就是得到了這個預設的源op,其中run(init)就是來進行初始化計算圖。