Tensorflow 學習筆記之使用LSTM實現MNIST資料集

阿新 • • 發佈：2019-02-19

LSTM實現MNIST手寫集識別

這幾天剛好看了RNN之後瞭解了LSTM（原理可以去參考這個）。雖然LSTM主要用於處理自然語言、語音、機器人翻譯等領域，但圖片也可以看做一個有序列的資料。所以用LSTM來識別Tensorflow入門資料集。

配置神經網路引數

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data

mnist = input_data.read_data_sets('C:\\Users\\Qigq\\Desktop'
                                  '\\P_Data\\LSTM\\LSTM_TEST\\data' 
,one_hot=True)

batch_size = 128        # 批次大小
num_units = 128         # 單元數(就是有幾個A)
input_size = 28         # 輸入資料單個序列的長度
time_steps = 28         # 序列本身的長度
classes = 10            # 分類
train_step = 10000      # 訓練次數
learnning_rate = 1e-4   # 學習率

在這裡插入圖片描述

LSTM之後有一層全連線層和softmax分類層所以要配置全連線層weights和biases

w = tf. 
Variable(tf.truncated_normal([num_units,classes]),dtype=tf.float32)
b = tf.Variable(tf.constant(value=0.1,shape=[classes]),dtype=tf.float32)

x = tf.placeholder(dtype=tf.float32,shape=[None,784])   # 28*28
y = tf.placeholder(dtype=tf.float32,shape=[None,10])

定義神經網路

def lstm_softmax(x,w,b):
    x = 
 tf.reshape(x,[-1,num_units,input_size]) #這裡需要reshape一下以符合神經網路輸入
    lstm_cell = tf.nn.rnn_cell.BasicLSTMCell(num_units=num_units)
    outputs,final_state = tf.nn.dynamic_rnn(lstm_cell,x,dtype=tf.float32)
    softmax = tf.nn.softmax(tf.matmul(final_state[1],w)+b)
    return softmax

定義方向傳播過程

prediction = lstm_softmax(x,w,b)
loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=prediction,labels=y))
optimizer = tf.train.AdamOptimizer(learnning_rate).minimize(loss)
correct_prediction = tf.equal(tf.argmax(y,1),tf.argmax(prediction,1))#argmax返回一維張量中最大的值所在的位置
accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))#把correct_prediction變為float32型別
init = tf.initialize_all_variables()

with tf.Session() as sess:
    sess.run(init)
    for i in range(10000):
        batch_xs, batch_ys = mnist.train.next_batch(batch_size)
        sess.run(optimizer,feed_dict={x:batch_xs,y:batch_ys})
        loss_value = sess.run(loss,feed_dict={x:batch_xs,y:batch_ys})
        acc = sess.run(accuracy, feed_dict={x: mnist.test.images, y: mnist.test.labels})
        print("step",i," loss:",loss_value)
        print("acc:",acc)

大概經過3000步的時候準確率到達94%，這個準確率在只有一層LSTM的時候應該算挺好了吧。
在這裡插入圖片描述
這裡需要特別說一下tf.nn.dynamic_rnn這個函式的兩個返回值。

outputs,final_state = tf.nn.dynamic_rnn(lstm_cell,x,dtype=tf.float32)
outputs是所有的h（看lstm結構圖）
final_state是（c,h）
outputs[:,-1,:]和final_state[1]是相同的。

如有錯處還請多多指點。

Tensorflow 學習筆記之使用LSTM實現MNIST資料集

LSTM實現MNIST手寫集識別這幾天剛好看了RNN之後瞭解了LSTM（原理可以去參考這個）。雖然LSTM主要用於處理自然語言、語音、機器人翻譯等領域，但圖片也可以看做一個有序列的資料。所以用LSTM

TensorFlow學習筆記（五）—— MNIST —— 資料下載，讀取

MNIST資料下載本教程的目標是展示如何下載用於手寫數字分類問題所要用到的（經典）MNIST資料集。教程檔案本教程需要使用以下檔案：檔案目的下載用於訓練和測試的MNIST資料集的原始碼備註： input_data.py

基於Tensorflow的雙層迴圈神經網路RNN(LSTM)實現(MNIST資料集)

本文使用雙層LSTM網路，實現對MNIST資料集的分類。 # -*- coding:utf-8 -*- import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_dat

深度學習框架tensorflow學習與應用4（MNIST資料集分類的簡單版本示例）

資料集我們要訓練機器學習, 那麼就要用到訓練資料. 這次我們使用MNIST_data資料集在程式中要匯入該資料集, 語句:mnist = input_data.read_data_sets("MNIST_data", one_hot=True)one_hot 意思是把資料集變成[

TensorFlow之神經網路簡單實現MNIST資料集分類

import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data mnist=input_data.read_data_sets("MNIST_data",one_hot=True) ba

TensorFlow之卷積神經網路(CNN)實現MNIST資料集分類

import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data mnist=input_data.read_data_sets('MNIST_data',one_hot=True) #每

tensorflow學習筆記之使用tensorflow進行MNIST分類（3）

在載入MNIST資料集時候用到了Input_data.py。這段程式碼其實非常重要，現在和大家一起分享一下我的學習理解 #coding=utf-8 #input_data.py的詳解 #學習讀取資料檔案的方法，以便讀取自己需要的資料庫檔案（二進位制檔案） """Funct

tensorflow學習筆記之使用tensorflow進行MNIST分類（2）

接著上一篇：http://blog.csdn.net/IEEE_FELLOW/article/details/53012351 本文參考Yann LeCun的LeNet5經典架構，稍加ps得到下面適用於本手寫識別的cnn結構，構造一個兩層卷積神經網路，神經網路的結構如下圖

tensorflow實現LSTM進行MNIST資料集分類

大大的部落格講得很詳細，先拿過來分享一下：http://blog.csdn.net/jerr__y/article/details/61195257 自己組合的第一部分程式碼： import sys reload(sys) sys.setdefaultencoding('

tensorflow學習筆記(三)：實現自編碼器

sea start ear var logs cos soft 編碼 red 黃文堅的tensorflow實戰一書中的第四章，講述了tensorflow實現多層感知機。Hiton早年提出過自編碼器的非監督學習算法，書中的代碼給出了一個隱藏層的神經網絡，本人擴展到了多層，改進

算法(第四版)學習筆記之java實現可以動態調整數組大小的棧

length pub move sta gen font -c @override lifo 下壓(LIFO)棧：可以動態調整數組大小的實現 import java.util.Iterator; public class ResizingArrayStack&l

Tensorflow學習筆記之池化

Tensorflow學習筆記之池化在深度學習網路中，經常會遇到池化操作，並且往往是在卷積之後，池化操作的意義是降低卷積層輸出特徵向量的維度，並且通過不同的池化方法使不同維度的卷積層輸出結果得到相同維度的特徵向量結果。 1、一般池化池化過程作用於不重疊區域我們定義池化視窗的大小為s

Tensorflow學習筆記之tf.nn.relu

Tensorflow學習筆記之tf.nn.relu 關於Tensorflow的學習筆記大部分為其他部落格或者書籍轉載，只為督促自己學習。線性整流函式（Rectified Linear Unit，ReLU），又稱修正線性單元。其定義如下圖，在橫座標的右側，ReLU函式為線性函式。在橫座標

Tensorflow學習筆記之tf.layers.conv2d

Tensorflow學習筆記關於Tensorflow的學習筆記大部分為其他部落格或者書籍轉載，只為督促自己學習。 conv2d(inputs, filters, kernel_size, strides=(1, 1), padding='valid', d

TensorFlow學習筆記（1）—— MNIST手寫識別

1、初步學習資料處理 xs：60000張圖片，28*28大小，將所有畫素點按一列排列，資料集變為了[60000, 784]的二維矩陣。 ys：60000張圖片，每個圖片有一個標籤標識圖片中數字，採用one-hot向量，資料集變為[60000, 10]的二維矩陣。 softm

Python 學習筆記之——用 sklearn 對資料進行預處理

1. 標準化標準化是為了讓資料服從一個零均值和單位方差的標準正態分佈。也即針對一個均值為 m e

TensorFlow學習筆記之--[tf.clip_by_global_norm,tf.clip_by_value,tf.clip_by_norm等的區別]

以下這些函式可以用於解決梯度消失或梯度爆炸問題上。 1. tf.clip_by_value tf.clip_by_value( t, clip_value_min, clip_value_max, name=None ) 輸入一個張量t，把t中的每一個元素的值都

TensorFlow學習筆記（六）—— MNIST —— 入門

MNIST機器學習入門這個教程的目標讀者是對機器學習和TensorFlow都不太瞭解的新手。如果你已經瞭解MNIST和softmax迴歸(softmax regression)的相關知識，你可以閱讀這個快速上手教程。當我們開始學習程式設計的時候，第一件事往往是學習列印

TensorFlow學習筆記（七）—— MNIST —— 進階

構建一個多層卷積網路在MNIST上只有91%正確率，實在太糟糕。在這個小節裡，我們用一個稍微複雜的模型：卷積神經網路來改善效果。這會達到大概99.2%的準確率。雖然不是最高，但是還是比較讓人滿意。權重初始化為了建立這個模型，我們需要建立大量的權重和偏置項。這個模型

資料結構與演算法學習筆記之適合大規模的資料排序

前言　　在資料排序的演算法中，不同資料規模應當使用合適的排序演算法才能達到最好的效果，如小規模的資料排序，可以使用氣泡排序、插入排序，選擇排序，他們的時間複雜度都為O（n2），大規模的資料排序就可以使用歸併排序和快速排序，時間複雜度為O（nlogn）。今天我們就來看一下歸併排序和快速排序。正文　　

Tensorflow 學習筆記之使用LSTM實現MNIST資料集

LSTM實現MNIST手寫集識別

相關推薦