tensorflow入門：mnist

阿新 • • 發佈：2019-02-11

1. mnist資料集的獲取和使用

1.1獲取mnist

from tensorflow.contrib.learn.python.learn.datasets.mnist import read_data_sets
mnist = read_data_sets("MNIST_data/", one_hot=True) # "MNIST_data/"是資料儲存的位置，one-hot是否把label變成one-hot編碼

1.2使用mnist

mnist.train.next_batch(50) #batch的方式獲取
mnist.test.images，mnist.test.labels #全部獲取

2.使用tf.layers搭建cnn識別模型

x = tf.placeholder('float', [None, 28*28]) #輸入，mnist讀入的資料是28*28的，而非一個矩陣
y_ = tf.placeholder('float', [None, 10])
# cnn model
x_image = tf.reshape(x, [-1,28,28,1]) #轉輸入為圖片格式
w_init = tf.truncated_normal_initializer(stddev=0.1, seed=9)#引數初始化器
b_init = tf.constant_initializer(0.1)
# 第一層cnn和max_pooling
cnn1 = tf.layers.conv2d(x_image, 32, (5,5), padding='same', activation=tf.nn.relu, \
	kernel_initializer=w_init, bias_initializer=b_init)
mxpl1 = tf.layers.max_pooling2d(cnn1, 2, strides=2, padding='same')
# 第二層cnn和max_pooling
cnn2 = tf.layers.conv2d(mxpl1, 64, (5,5), padding='same', activation=tf.nn.relu, \
	kernel_initializer=w_init, bias_initializer=b_init)
mxpl2 = tf.layers.max_pooling2d(cnn2, 2, strides=2, padding='same')
mxpl2_flat = tf.reshape(mxpl2, [-1,7*7*64])
#全連線1和dropout
fc1 = tf.layers.dense(mxpl2_flat, 1024, activation=tf.nn.relu, \
	kernel_initializer=w_init, bias_initializer=b_init)
keep_prob = tf.placeholder('float')
fc1_drop = tf.nn.dropout(fc1, keep_prob)
logits = tf.layers.dense(fc1_drop, 10, kernel_initializer=w_init, bias_initializer=b_init)

3.損失函式loss和優化器

loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=logits, labels=y_)) #交叉熵損失
optmz = tf.train.AdamOptimizer(1e-4) #Adam優化器，學習率1e-4
train_op = optmz.minimize(loss)

4.評估：識別準確率

def get_eval_op(logits, labels):
	corr_prd = tf.equal(tf.argmax(logits,1), tf.argmax(labels,1))
	return tf.reduce_mean(tf.cast(corr_prd, 'float'))
eval_op = get_eval_op(logits, y_)

5.訓練

for i in range(train_steps): #batch size為50，通過feed_dict傳入資料給placeholder，summary_op是logger operation，後面會講到，不需要可以不加

batch_x, batch_y = mnist.train.next_batch(50)
_, cur_loss, cur_train_eval, summary = sess.run([train_op, loss, eval_op, summary_op], \
	feed_dict={x: batch_x, y_: batch_y, keep_prob: 0.5} )

6.評估測試集

test_loss, test_eval = sess.run([loss, eval_op], feed_dict={x:mnist.test.images, \
	y_:mnist.test.labels, keep_prob: 1.0})

7.輸出tensorboard的log

logdir = './logs/d31'
#要記錄的物件，loss和eval_op
def summary_op(datapart='train'):
    tf.summary.scalar(datapart + '-loss', loss)
    tf.summary.scalar(datapart + '-eval', eval_op)
    return tf.summary.merge_all()
summary_op_train = summary_op()
summary_op_test = summary_op('test')
#建立log writer
summary_wrt = tf.summary.FileWriter(logdir,sess.graph)
#執行summary_op並新增 summary
summary = sess.run(summary_op_train, feed_dict={x: batch_x, y_: batch_y, keep_prob: 0.5})
summary_wrt.add_summary(summary, global_step=i) #i為當前訓練的step

8.模型引數儲存和恢復

ckpts_dir = 'ckpts/'
ckpt_nm = 'cnn-ckpt'
#建立saver
saver = tf.train.Saver(max_to_keep=50)
#在sess中使用saver的save和restore
#save引數
saver.save(sess, ckpts_dir+ckpt_nm, global_step=i)
#恢復最近的引數
saver.restore(sess, tf.train.latest_checkpoint(ckpts_dir))
#恢復指定的引數，restore_step為指定的step
saver.restore(sess, ckpts_dir+ckpt_nm+'-'+restore_step)

9.配置gpu的使用

#指定使用哪塊gpu
import os
os.environ["CUDA_VISIBLE_DEVICES"] = "0"
config = tf.ConfigProto()  
#限制使用比率 
config.gpu_options.per_process_gpu_memory_fraction = 0.9
#按需分配
config.gpu_options.allow_growth=True # allocate when needed
#傳入session中 
tf.Session(config=config)

10.完整程式碼

import tensorflow as tf
from tensorflow.contrib.learn.python.learn.datasets.mnist import read_data_sets

mnist = read_data_sets("MNIST_data/", one_hot=True)

x = tf.placeholder('float', [None, 28*28])
y_ = tf.placeholder('float', [None, 10])

# 自定義全連線
# W = tf.Variable(tf.zeros([784, 10]))
# b = tf.Variable(tf.zeros([10]))
# logits = tf.matmul(x, W) + b

# cnn模型
x_image = tf.reshape(x, [-1,28,28,1])
w_init = tf.truncated_normal_initializer(stddev=0.1, seed=9)
b_init = tf.constant_initializer(0.1)
cnn1 = tf.layers.conv2d(x_image, 32, (5,5), padding='same', activation=tf.nn.relu, \
	kernel_initializer=w_init, bias_initializer=b_init)
mxpl1 = tf.layers.max_pooling2d(cnn1, 2, strides=2, padding='same')
cnn2 = tf.layers.conv2d(mxpl1, 64, (5,5), padding='same', activation=tf.nn.relu, \
	kernel_initializer=w_init, bias_initializer=b_init)
mxpl2 = tf.layers.max_pooling2d(cnn2, 2, strides=2, padding='same')
mxpl2_flat = tf.reshape(mxpl2, [-1,7*7*64])
fc1 = tf.layers.dense(mxpl2_flat, 1024, activation=tf.nn.relu, \
	kernel_initializer=w_init, bias_initializer=b_init)
keep_prob = tf.placeholder('float')
fc1_drop = tf.nn.dropout(fc1, keep_prob)
logits = tf.layers.dense(fc1_drop, 10, kernel_initializer=w_init, bias_initializer=b_init)

loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=logits, labels=y_))
optmz = tf.train.AdamOptimizer(1e-4)
train_op = optmz.minimize(loss)

def get_eval_op(logits, labels):
	corr_prd = tf.equal(tf.argmax(logits,1), tf.argmax(labels,1))
	return tf.reduce_mean(tf.cast(corr_prd, 'float'))
eval_op = get_eval_op(logits, y_)

init = tf.initialize_all_variables()

# summary
logdir = './logs/m4d1'
def summary_op(datapart='train'):
	tf.summary.scalar(datapart + '-loss', loss)
	tf.summary.scalar(datapart + '-eval', eval_op)
	return tf.summary.merge_all()	
summary_op_train = summary_op()
summary_op_test = summary_op('test')
# whether to restore or not
ckpts_dir = 'ckpts/'
ckpt_nm = 'cnn-ckpt'
saver = tf.train.Saver(max_to_keep=50) # defaults to save all variables, using dict {'x':x,...} to save specified ones.
restore_step = ''
start_step = 0
train_steps = 100*200
best_loss = 1e6
best_step = 0

# import os
# os.environ["CUDA_VISIBLE_DEVICES"] = "0"
# config = tf.ConfigProto()  
# config.gpu_options.per_process_gpu_memory_fraction = 0.9
# config.gpu_options.allow_growth=True # allocate when needed
# with tf.Session(config=config) as sess:
with tf.Session() as sess:
	sess.run(init)
	if restore_step:
		ckpt = tf.train.get_checkpoint_state(ckpts_dir)
		if ckpt and ckpt.model_checkpoint_path: # ckpt.model_checkpoint_path means the latest ckpt
			if restore_step == 'latest':
				ckpt_f = tf.train.latest_checkpoint(ckpts_dir)
				start_step = int(ckpt_f.split('-')[-1]) + 1
			else:
				ckpt_f = ckpts_dir+ckpt_nm+'-'+restore_step
			print('loading wgt file: '+ ckpt_f)
			saver.restore(sess, ckpt_f) 
	summary_wrt = tf.summary.FileWriter(logdir,sess.graph)
	if restore_step in ['', 'latest']:
		for i in range(start_step, train_steps):
			batch_x, batch_y = mnist.train.next_batch(50)
			_, cur_loss, cur_train_eval, summary = sess.run([train_op, loss, eval_op, summary_op_train], \
						feed_dict={x: batch_x, y_: batch_y, keep_prob: 0.5} )
			# log to stdout and eval test set
			if i % 100 == 0 or i == train_steps-1:
				if cur_loss < best_loss:
					best_loss = cur_loss
					best_step = i
				saver.save(sess, ckpts_dir+ckpt_nm, global_step=i) # save variables
				summary_wrt.add_summary(summary, global_step=i)
				cur_test_eval, summary = sess.run([eval_op, summary_op_test], feed_dict={x:mnist.test.images, \
						y_:mnist.test.labels, keep_prob: 1.0})
				summary_wrt.add_summary(summary, global_step=i)
				print 'step %5d, loss %.5f, acc train %.5f, acc test %.5f'%(i, \
					cur_loss, cur_train_eval, cur_test_eval)
		with open(ckpts_dir+'best.step','w') as f:
			f.write('best step is %d\n'%best_step)
		print 'best step is %d'%best_step
	else:
		test_loss, test_eval = sess.run([loss, eval_op], feed_dict={x:mnist.test.images, \
						y_:mnist.test.labels, keep_prob: 1.0})
		print 'eval test: loss %.5f, acc %.5f'%(test_loss, test_eval)

tensorflow入門：mnist

1. mnist資料集的獲取和使用1.1獲取mnistfrom tensorflow.contrib.learn.python.learn.datasets.mnist import read_data_sets mnist = read_data_sets("MNIST_d

深度學習：tensorflow入門：卷積神經網路實現MNIST手寫字型識別

程式碼中./data/mnist/input_data/為真實MNIST資料集的路徑 import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data # 定義

TensorFlow入門：mac 安裝 TensorFlow

sse ssi 來安 pan lan bin pat ont world 開發環境： mac os 10.12.5 Python 2.7.10 GCC 4.2.1 mac默認是不帶pip的，安裝pip。 sudo easy_install pip 1.安裝vir

TensorFlow入門：安裝常用的依賴模塊

包含 librosa 任務 nltk plot orf 入門 learn sci TensorFlow運行中常用到一些Python第三方模塊： numpy 存儲和處理大型矩陣的科學計算包 maplotlib 最著名的繪圖庫 jupyter scikit-image 圖像預

[AI教程]tensorflow入門：Hello World與基本操作

文章目錄 1.tensorflow介紹 2.Hello World 3.基本操作 1.tensorflow介紹 TensorFlow™ 是一個採用資料流圖（data flow graphs），用於數值計算的開源軟體庫。節點（Nodes）

tensorbosrd出現No graph definition files were found，補充內容以下內容轉載自https://blog.csdn.net/u014165082/article/details/79556366 tensorflow入門：新版本語法改動以及tensorbo

tensorbosrd出現No graph definition files were found，補充內容在writer=tf.summary.FileWriter('./my_graph',sess.graph) 一句中， ./my_graph的絕對路徑不允許出現漢語，否則就會出現No

深度學習：tensorflow入門：tf讀入資料

同步讀取資料 import tensorflow as tf # 模擬一下同步先處理資料，然後才能取訓練資料 # tensorflow中，執行操作有依賴性 # 1、首先定義佇列 Q = tf.FIFOQueue(3, tf.float32) # 放入一些資

tensorflow實戰：MNIST手寫數字識別的優化2-代價函式優化，準確率98%

最簡單的tensorflow的手寫識別模型，這一節我們將會介紹其簡單的優化模型。我們會從代價函式，多層感知器，防止過擬合，以及優化器的等幾個方面來介紹優化過程。 1.代價函式的優化：我們可以這樣將代價函式理解為真實值與預測值的差距，我們神經

[AI教程]TensorFlow入門：Simple Linear Model

介紹本文演示了使用簡單線性模型瞭解TensorFlow的基本工作流程。資料集：MNIST資料集工具：TensorFlow 1.9.0 + Python 3.6.3 方法：簡單線性模型 1、import import matplotlib.pyplot as

[AI教程]TensorFlow入門：訓練卷積網路模型解決分類問題

介紹 1.相關包匯入 // An highlighted block import math import numpy as np import h5py import matplotlib.pyplot as plt import scipy from PI

[AI教程]TensorFlow入門：手勢數字識別

實驗說明本實驗為吳恩達課後程式設計作業第二課第三週內容，通過引導我們將完成一個深度學習框架，使我們可以更輕鬆地構建神經網路。程式設計框架不僅可以縮短編碼時間，而且有時還可以執行加速程式碼的優化。資料集下載地址：[https://github.com/stor

python3.6 + tensorflow入門：三維點擬合平面

參考連結： http://wiki.jikexueyuan.com/project/tensorflow-zh/get_started/introduction.html 程式碼： # -*- coding: utf-8 -*- """ Created on Fri Dec 21 14:

Tensorflow入門二 mnist識別（一）

話不多說，直接上程式碼看註釋就 OK 啦 import numpy as np import sklearn.preprocessing as prep import tensorflow as tf from tensorflow.examples.tutorials.

TensorFlow入門之MNIST樣例程式碼分析

這幾天想系統的學習一下TensorFlow，為之後的工作打下一些基礎。看了下《TensorFlow:實戰Google深度學習框架》這本書，目前個人覺得這本書還是對初學者挺友好的，作者站在初學者的角度講解TensorFlow，所以比較容易理解。這篇博文主要是為了分析其中的一個經

TensorFlow入門：tf.InteractiveSession()與tf.Session()區別

tf.InteractiveSession():它能讓你在執行圖的時候，插入一些計算圖，這些計算圖是由某些操作(operations)構成的。這對於工作在互動式環境中的人們來說非常便利，比如使用IPython。 tf.Session():需要在啟動session之前構建

TensorFlow入門之MNIST最佳實踐-深度學習

模型保存 tro 網絡選擇手寫找到 default 輸入自定義在上一篇《TensorFlow入門之MNIST樣例代碼分析》中，我們講解了如果來用一個三層全連接網絡實現手寫數字識別。但是在實際運用中我們需要更有效率，更加靈活的代碼。在TensorFlow實戰這本書中

TensorFlow入門：第一個機器學習Demo

本文主要通過一個簡單的 Demo 介紹 TensorFlow 初級 API 的使用方法，因為自己也是初學者，因此本文的目的主要是引導剛接觸 TensorFlow 或者機器學習的同學，能夠從第一步開始學習 TensorFlow。閱讀本文先確認具備以下基礎技能：

TensorFlow 從入門到精通（二）：MNIST 例程原始碼分析

按照上節步驟， TensorFlow 預設安裝在 /usr/lib/python/site-packages/tensorflow/ （也有可能是 /usr/local/lib……）下，檢視目錄結構： # tree -d -L 3 /usr/lib/pyt

Tensorflow（1）：MNIST識別自己手寫的數字--入門篇（Softmax迴歸）

機器學習入門都是從MNIST開始，Tensorflow官方社群提供了十分詳細的教程【MNIST機器學習入門】。但是我們顯然不滿足於僅僅把官方的程式碼複製一遍然後輸出個結果，我們想能不能實現自己手寫數字的識別。本文作為Tensorflow入門，結合官方

tensorflow 基礎學習五：MNIST手寫數字識別

truncate averages val flow one die correct 表示 data MNIST數據集介紹： from tensorflow.examples.tutorials.mnist import input_data # 載入MNIST數據集，

tensorflow入門：mnist

1. mnist資料集的獲取和使用

1.1獲取mnist

1.2使用mnist

2.使用tf.layers搭建cnn識別模型

3.損失函式loss和優化器

4.評估：識別準確率

5.訓練

6.評估測試集

7.輸出tensorboard的log

8.模型引數儲存和恢復

9.配置gpu的使用

10.完整程式碼

相關推薦