『TensorFlow』隊列&多線程&TFRecod文件_我輩當高歌

阿新 • • 發佈：2017-06-04

gradient 函數 http who epo variable nbsp 其他新建

TF數據讀取隊列機制詳解

TFR文件多線程隊列讀寫操作：

- TFRecod文件寫入操作：

import tensorflow as tf
def _int64_feature(value):
    # value必須是可叠代對象
    # 非int的數據使用bytes取代int64即可
    return tf.train.Feature(int64_list=tf.train.Int64List(value=[value]))
num_shards = 2
instance_perPshard = 2
for i in range(num_shards):
    filename = (‘FTR/data.tfrecords-%.5d-of-%.5d‘ % (i, num_shards))
    writer = tf.python_io.TFRecordWriter(filename)                      #<---------書寫器打開
    for j in range(instance_perPshard):
        example = tf.train.Example(features=tf.train.Features(feature={ #<---------書寫入緩沖區
            ‘i‘:_int64_feature(i),
            ‘j‘:_int64_feature(j)
        }))
        writer.write(example.SerializeToString())                       #<---------書寫入實際文件
    writer.close()                                                      #<---------書寫器關閉

- TFRecod文件讀取操作：

默認多線程，這個默認的多線程過程用於維護文件名隊列

‘‘‘讀取TFR‘‘‘

files = ["FTR/data.tfrecords-00000-of-00002","FTR/data.tfrecords-00001-of-00002"]
# files = tf.train.match_filenames_once("FTR/data.tfrecords-*")

# 輸入文件名列表
# 返回QueueRunner & FIFOQueue
# 打亂順序&加入隊列 和 輸出隊列獲取文件 屬於單獨的線程
filename_queue = tf.train.string_input_producer(files, shuffle=False) #<---------輸入文件隊列
reader = tf.TFRecordReader()                        #<---------讀取器打開
_,serialized_example = reader.read(filename_queue)  #<---------讀取原始文件
features = tf.parse_single_example(                 #<---------讀取解析後文件
    serialized_example,
    features={
        ‘i‘:tf.FixedLenFeature([],tf.int64),
        ‘j‘:tf.FixedLenFeature([],tf.int64)
    })

with tf.Session() as sess:
    tf.global_variables_initializer().run()
    coord = tf.train.Coordinator() #<---------多線程
    threads = tf.train.start_queue_runners(sess=sess,coord=coord) #<---------文件名隊列填充線程啟動
    for i in range(6):
        print(sess.run([features[‘i‘],features[‘j‘]]))            #<---------實際會話中啟動讀取過程
    coord.request_stop()           #<---------多線程
    coord.join(threads)            #<---------多線程

- TFRecod文件打包操作：

打包機制：

——————多線程調用前面的節點計算入隊

——————批量出隊並打包

所以不需要修改解析讀取數據過程為循環之類的，可以說很是方便

example_batch, label_batch = tf.train.batch([example, label],     #<---------多線程batch生成
                                            batch_size=batch_size,
                                            num_threads=3,
                                            capacity=capacity)

example_batch, label_batch = tf.train.shuffle_batch([example, label],     #<---------多線程隨機batch生成
                                            batch_size=batch_size,
                                            num_threads=3,
                                            capacity=capacity,
                                            min_after_dequeue=30)     由於元素太少隨機意義就不大了，所以多了個參數

files = ["FTR/data.tfrecords-00000-of-00002","FTR/data.tfrecords-00001-of-00002"]
# files = tf.train.match_filenames_once("FTR/data.tfrecords-*")

# 輸入文件名列表
# 返回QueueRunner & FIFOQueue
# 打亂順序&加入隊列 和 輸出隊列獲取文件 屬於單獨的線程
filename_queue = tf.train.string_input_producer(files, shuffle=False) #<---------輸入文件隊列
reader = tf.TFRecordReader()                        #<---------讀取
_,serialized_example = reader.read(filename_queue)  #<---------讀取
features = tf.parse_single_example(                 #<---------讀取
    serialized_example,
    features={
        ‘i‘:tf.FixedLenFeature([],tf.int64),
        ‘j‘:tf.FixedLenFeature([],tf.int64)
    })

example, label = features[‘i‘], features[‘j‘]
batch_size = 2
capacity = 1000 + 3 * batch_size

# 入隊單個樣例，出隊batch
# 可以指定多個線程同時執行入隊操作
example_batch, label_batch = tf.train.batch([example, label],     #<---------多線程batch生成
                                            batch_size=batch_size,
                                            num_threads=3,
                                            capacity=capacity)
with tf.Session() as sess:
    tf.global_variables_initializer().run()
    coord = tf.train.Coordinator()                                #<---------多線程管理器
    threads = tf.train.start_queue_runners(sess=sess,coord=coord) #<---------文件名隊列填充線程啟動
    for i in range(3):
        cur_example_batch, cur_label_batch = sess.run([example_batch, label_batch])
        print(cur_example_batch, cur_label_batch)
    coord.request_stop()                                          #<---------多線程關閉
    coord.join(threads)

這個輸出每一行前為image（代指），後為label，第一行的數據對實際為0-0,0-1:

[0 0] [0 1]
[1 1] [0 1]
[0 0] [0 1]

圖片文件使用TFR讀寫測試：

read的二進制數據直接進行_bytes_feature化就可以寫入文件，使用tf.string類型讀出圖片數據後可以直接decode解碼之（推測tf中string對應二進制數據類型）。

把一張圖片寫入TFR中：

import tensorflow as tf
import matplotlib.pyplot as plt

def _bytes_feature(value):
    return tf.train.Feature(bytes_list=tf.train.BytesList(value=[value]))
def _int64_feature(value):
    return tf.train.Feature(int64_list=tf.train.Int64List(value=[value]))
img_raw = tf.gfile.FastGFile(‘123123.jpeg‘,‘rb‘).read()

filename = (‘FTR/image.tfrecords‘)
writer = tf.python_io.TFRecordWriter(filename) #<---------書寫
example = tf.train.Example(features=tf.train.Features(feature={ #<---------書寫
    ‘image‘:_bytes_feature(img_raw),
    ‘label‘:_int64_feature(1)
    }))
writer.write(example.SerializeToString()) #<---------書寫
writer.close()

從TFR中讀取圖片數據並解碼繪制出來：

filename_queue = tf.train.string_input_producer([‘FTR/image.tfrecords‘], shuffle=False) #<---------輸入文件隊列
reader = tf.TFRecordReader()                        #<---------讀取
_,serialized_example = reader.read(filename_queue)  #<---------讀取
features = tf.parse_single_example(                 #<---------讀取
    serialized_example,
    features={
        ‘image‘:tf.FixedLenFeature([],tf.string),
        ‘label‘:tf.FixedLenFeature([],tf.int64)
    })
img = tf.image.decode_jpeg(features[‘image‘])
with tf.Session() as sess:
    tf.global_variables_initializer().run()

    coord = tf.train.Coordinator()  # <---------多線程
    threads = tf.train.start_queue_runners(sess=sess, coord=coord)  # <---------文件名隊列填充線程啟動
    # img_raw, label = sess.run([features[‘image‘], features[‘label‘]])
    image = sess.run(img)
    plt.imshow(image)
    plt.show()
    coord.request_stop()  # <---------多線程
    coord.join(threads)  # <---------多線程

圖片文件直接使用隊列讀寫操作：

僅僅示範了維護圖片文件名隊列的讀寫，沒有過多的其他操作

reader = tf.WholeFileReader()：新的讀取器，應該是範用性二進制文件讀取器

# 導入tensorflow
import tensorflow as tf

# 新建一個Session
with tf.Session() as sess:
    # 我們要讀三幅圖片A.jpg, B.jpg, C.jpg
    filename = [‘123.png‘, ‘123123.jpeg‘]
    # string_input_producer會產生一個文件名隊列
    filename_queue = tf.train.string_input_producer(filename, shuffle=False, num_epochs=5)
    # reader從文件名隊列中讀數據。對應的方法是reader.read
    reader = tf.WholeFileReader()                             #<---------註意讀取器不一樣了
    key, value = reader.read(filename_queue)
    # tf.train.string_input_producer定義了一個epoch變量，要對它進行初始化
    tf.local_variables_initializer().run()
    # 使用start_queue_runners之後，才會開始填充隊列
    threads = tf.train.start_queue_runners(sess=sess)
    i = 0
    while True:
        i += 1
        # 獲取圖片數據並保存
        image_data = sess.run(value)
        with open(‘test_%d.jpg‘ % i, ‘wb‘) as f:
            f.write(image_data)

書上的隊列文件使用樣例：

文件名隊列創建->讀取解析文件->打包解析好的文件->多線程啟動圖訓練（多線程指被使用的部分其實還是文件讀取）

import tensorflow as tf


‘‘‘創建文件列表‘‘‘

files = tf.train.match_filenames_once("Records/output.tfrecords")
filename_queue = tf.train.string_input_producer(files, shuffle=False)


‘‘‘解析TFRecord文件裏的數據‘‘‘

# 讀取文件。

reader = tf.TFRecordReader()
_,serialized_example = reader.read(filename_queue)

# 解析讀取的樣例。
features = tf.parse_single_example(
    serialized_example,
    features={
        ‘image_raw‘:tf.FixedLenFeature([],tf.string),
        ‘pixels‘:tf.FixedLenFeature([],tf.int64),
        ‘label‘:tf.FixedLenFeature([],tf.int64)
    })

decoded_images = tf.decode_raw(features[‘image_raw‘],tf.uint8)
retyped_images = tf.cast(decoded_images, tf.float32)
labels = tf.cast(features[‘label‘],tf.int32)
#pixels = tf.cast(features[‘pixels‘],tf.int32)
images = tf.reshape(retyped_images, [784])


‘‘‘將文件以100個為一組打包‘‘‘

min_after_dequeue = 10000
batch_size = 100
capacity = min_after_dequeue + 3 * batch_size

image_batch, label_batch = tf.train.shuffle_batch([images, labels],
                                                    batch_size=batch_size,
                                                    capacity=capacity,
                                                    min_after_dequeue=min_after_dequeue)


‘‘‘訓練模型‘‘‘


def inference(input_tensor, weights1, biases1, weights2, biases2):
    layer1 = tf.nn.relu(tf.matmul(input_tensor, weights1) + biases1)
    return tf.matmul(layer1, weights2) + biases2


# 模型相關的參數
INPUT_NODE = 784
OUTPUT_NODE = 10
LAYER1_NODE = 500
REGULARAZTION_RATE = 0.0001
TRAINING_STEPS = 5000

weights1 = tf.Variable(tf.truncated_normal([INPUT_NODE, LAYER1_NODE], stddev=0.1))
biases1 = tf.Variable(tf.constant(0.1, shape=[LAYER1_NODE]))

weights2 = tf.Variable(tf.truncated_normal([LAYER1_NODE, OUTPUT_NODE], stddev=0.1))
biases2 = tf.Variable(tf.constant(0.1, shape=[OUTPUT_NODE]))

y = inference(image_batch, weights1, biases1, weights2, biases2)

# 計算交叉熵及其平均值
cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=y, labels=label_batch)
cross_entropy_mean = tf.reduce_mean(cross_entropy)

# 損失函數的計算
regularizer = tf.contrib.layers.l2_regularizer(REGULARAZTION_RATE)
regularaztion = regularizer(weights1) + regularizer(weights2)
loss = cross_entropy_mean + regularaztion

# 優化損失函數
train_step = tf.train.GradientDescentOptimizer(0.01).minimize(loss)

# 初始化回話並開始訓練過程。
with tf.Session() as sess:
    tf.global_variables_initializer().run()
    coord = tf.train.Coordinator()
    threads = tf.train.start_queue_runners(sess=sess, coord=coord)
    # 循環的訓練神經網絡。
    for i in range(TRAINING_STEPS):
        if i % 1000 == 0:
            print("After %d training step(s), loss is %g " % (i, sess.run(loss)))

        sess.run(train_step)
    coord.request_stop()
    coord.join(threads)

『TensorFlow』隊列&多線程&TFRecod文件_我輩當高歌

gradient 函數 http who epo variable nbsp 其他新建 TF數據讀取隊列機制詳解 TFR文件多線程隊列讀寫操作： TFRecod文件寫入操作： import tensorflow as tf def _in

TensorFlow筆記（7）-----實戰Google深度學習框架----隊列與多線程

一起 width nbsp stop 之前圖片第一個 queue enqueue 一、創建一個隊列： FIFOQueue：先進先出 RandomShuffleQueue：會將隊列中的元素打亂，每次出列操作得到的是從當前隊列所有元素中隨機選擇的一個。二、操作一個隊列的函

Tensorflow多線程輸入數據處理框架（一）——隊列與多線程

cast 支持 oop soft dom 集合 run 列操作 start 參考書《TensorFlow：實戰Google深度學習框架》（第2版）對於隊列，修改隊列狀態的操作主要有Enqueue、EnqueueMany和Dequeue。以下程序展示了如何使用這些函數來

爬蟲_鬥圖啦(隊列，多線程)

produce rom return range while rod 爬蟲 put 2.0 1 import threading 2 import requests 3 from lxml import etree 4 from urllib import

爬蟲_古詩文網(隊列，多線程，鎖，正則，xpath)

.get like type http pre stat apple writer except 1 import requests 2 from queue import Queue 3 import threading 4 from lxml

網絡編程——同一進程中的隊列（多線程）

字符串所有優先級優先級隊列當前進程字符網絡編程表示 import queue queue.Queue() 先進先出 queue.LifoQueue() 後進先出 queue.PriorityQueue() 優先級隊列　　優先級隊列 q = queue.Pr

Python隊列與多線程及文件鎖

元素 .data 就會 python col 執行混亂 pre join() 隊列實現生產-多線程消費先看代碼 # -*- coding: utf-8 -*- import queue import threading mu = threading.Lock()

python學習筆記之四-多進程&多線程&異步非阻塞

running executor 服務器 RoCE 進行 break python buffer 創建 ProcessPoolExecutor對multiprocessing進行了高級抽象，暴露出簡單的統一接口。異步非阻塞爬蟲對於異步IO請求的本質則是【非阻塞So

java多線程批量讀取文件(七)

object pack execute st3 mem cut eureka rgs ring 新公司入職一個多月了，至今沒有事情可以做，十來個新同事都一樣抓狂，所以大家都自己學習一些新東西，我最近在看zookeeper，感覺蠻不錯的，和微服務的zuul以及eureka功能

python 多線程批量傳文件

close utf pen 1.3 ems pan time target main #!/usr/bin/env python #_*_ coding:utf-8 -*-#autho:leiyong#time:2017-06-05#version: 1.3 impor

Java 多線程查找文件中的內容

file strong cto 文件內容 args pack pre stack err 學過了操作系統，突然不知道多線程有什麽用了。看了一下百度，發現多線程，可以提升系統利用率在系統進行IO操作的時候，CPU可以處理一些其他的東西，等IO讀取到內存後，CPU再處理

11.多線程&&並發

但是 pack dea end ont 運行速度觀察點擊進程和線程 11.1 操作系統中線程和進程的概念一些常見的概念: 程序:指令和數據的byte序列,eg:qq.exe;a2. 進程:正在運行的程序(如QQ);a3.一個進程中可能有一到多個線程. 線程的概念：T

Python開發基礎--- Event對象、隊列和多進程基礎

mina ces 停止阻塞隊列 con timeout 子進程 pri consumer Event對象用於線程間通信，即程序中的其一個線程需要通過判斷某個線程的狀態來確定自己下一步的操作，就用到了event對象 event對象默認為假（Flase），即遇到event對

python並發編程&多線程（一）

cpu調度系統調用 rabl behavior 運行時地址管理輕量級屬於本篇理論居多,實際操作見: 　　python並發編程&多線程(二) 一什麽是線程　　　　在傳統操作系統中，每個進程有一個地址空間，而且默認就有一個控制線程　　線

python:多進程，多進程隊列，多進程管道,Manager,進程鎖,進程池

子進程 __name__ art get 調用 sta manage parent call #!usr/bin/env python# -*- coding:utf-8 -*-__author__ = "Samson"import multiprocessingimpor

多線程&定時器Timer&同步&線程通信&ThreadLocal

技術分享 mar ribbon ++ AI ring 線程組 com fast 1.多線程線程狀態分為：新建狀態、就緒狀態、運行狀態、阻塞狀態、死亡狀態對象等待池的阻塞狀態：運行狀態執行了wait方法對向鎖池的阻塞狀態：試圖獲得某個同步

多線程&多進程

work 自動多進程 num ces 多線程分配 tar 一次一、多線程　　概念進程是程序在計算機上的一次執行活動。當你運行一個程序，你就啟動了一個進程。顯然，程序是死的(靜態的)，進程是活的(動態的)。進程可以分為系統進程和用戶進程。凡是用於完成操作系統的各種功

python--多線程&多進程

父類 lis pan lob 上下 request ive app python 進程：進程就是一組資源的集合線程是在進程裏面幹活的一個進程裏面至少有一個線程，這個線程就是主線程電腦CPU是幾核的就只能同時運行幾個

python開發線程:線程&守護線程&全局解釋器鎖

效果 args threads man 安全 mutex view 主線程 mem 一 threading模塊介紹 multiprocess模塊的完全模仿了threading模塊的接口，二者在使用層面，有很大的相似性，因而不再詳細介紹官網鏈接：https://docs.p

62.多線程多文件檢索,每個線程檢索一個文件,用於內存不夠的情況下

tdi 保存 dst 針對 ces inf 2個 printf fclose 1 #define _CRT_SECURE_NO_WARNINGS 2 #include<stdio.h> 3 #include<stdlib.h> 4

『TensorFlow』隊列&多線程&TFRecod文件_我輩當高歌

TF數據讀取隊列機制詳解

TFR文件多線程隊列讀寫操作：

TFRecod文件寫入操作：

TFRecod文件讀取操作：

TFRecod文件打包操作：

圖片文件使用TFR讀寫測試：

圖片文件直接使用隊列讀寫操作：

書上的隊列文件使用樣例：

相關推薦