TensorFlow數據集（一）——數據集的基本使用方法

阿新 • • 發佈：2019-02-10

cor mark get-data 註意輸入輸出 create amp lose urn

參考書

《TensorFlow：實戰Google深度學習框架》（第2版）

例子：從一個張量創建一個數據集，遍歷這個數據集，並對每個輸入輸出y = x^2 的值。

#!/usr/bin/env python
# -*- coding: UTF-8 -*-
# coding=utf-8 

"""
@author: Li Tian
@contact: [email protected]
@software: pycharm
@file: dataset_test1.py
@time: 2019/2/10 10:52
@desc: 例子：從一個張量創建一個數據集，遍歷這個數據集，並對每個輸入輸出y = x^2 的值。
 
"""

import tensorflow as tf

# 從一個數組創建數據集。
input_data = [1, 2, 3, 5, 8]
dataset = tf.data.Dataset.from_tensor_slices(input_data)

# 定義一個叠代器用於遍歷數據集。因為上面定義的數據集沒有用placeholder作為輸入參數
# 所以這裏可以使用最簡單的one_shot_iterator
iterator = dataset.make_one_shot_iterator()
# get_next() 返回代表一個輸入數據的張量，類似於隊列的dequeue()。
x = iterator.get_next()
y  
= x * x

with tf.Session() as sess:
    for i in range(len(input_data)):
        print(sess.run(y))

運行結果：

技術分享圖片 ?

數據是文本文件：創建數據集。

#!/usr/bin/env python
# -*- coding: UTF-8 -*-
# coding=utf-8 

"""
@author: Li Tian
@contact: [email protected]
@software: pycharm
@file: dataset_test2.py
@time: 2019/2/10 11:03
@desc: 數據是文本文件
 
"""

import tensorflow as tf

# 從文本文件創建數據集。假定每行文字是一個訓練例子。註意這裏可以提供多個文件。
input_files = [‘./input_file11‘, ‘./input_file22‘]
dataset = tf.data.TextLineDataset(input_files)

# 定義叠代器用於遍歷數據集
iterator = dataset.make_one_shot_iterator()
# 這裏get_next()返回一個字符串類型的張量，代表文件中的一行。
x = iterator.get_next()
with tf.Session() as sess:
    for i in range(4):
        print(sess.run(x))

運行結果：

技術分享圖片 ?

數據是TFRecord文件：創建TFRecord測試文件。

#!/usr/bin/env python
# -*- coding: UTF-8 -*-
# coding=utf-8 

"""
@author: Li Tian
@contact: [email protected]
@software: pycharm
@file: dataset_createdata.py
@time: 2019/2/10 13:59
@desc: 創建樣例文件
"""

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
import numpy as np
import time


# 生成整數型的屬性。
def _int64_feature(value):
    return tf.train.Feature(int64_list=tf.train.Int64List(value=[value]))


# 生成字符串型的屬性。
def _bytes_feature(value):
    return tf.train.Feature(bytes_list=tf.train.BytesList(value=[value]))


a = [11, 21, 31, 41, 51]
b = [22, 33, 44, 55, 66]


# 輸出TFRecord文件的地址
filename = ‘./input_file2‘
# 創建一個writer來寫TFRecord文件
writer = tf.python_io.TFRecordWriter(filename)
for index in range(len(a)):
    aa = a[index]
    bb = b[index]
    # 將一個樣例轉化為Example Protocol Buffer，並將所有的信息寫入這個數據結構。
    example = tf.train.Example(features=tf.train.Features(feature={
        ‘feat1‘: _int64_feature(aa),
        ‘feat2‘: _int64_feature(bb)
    }))

    # 將一個Example寫入TFRecord文件中。
    writer.write(example.SerializeToString())
writer.close()

運行結果：

技術分享圖片 ?

數據是TFRecord文件：創建數據集。（使用最簡單的one_hot_iterator來遍歷數據集）

#!/usr/bin/env python
# -*- coding: UTF-8 -*-
# coding=utf-8 

"""
@author: Li Tian
@contact: [email protected]
@software: pycharm
@file: dataset_test3.py
@time: 2019/2/10 13:16
@desc: 數據是TFRecord文件
"""

import tensorflow as tf


# 解析一個TFRecord的方法。record是從文件中讀取的一個樣例。前面介紹了如何解析TFRecord樣例。
def parser(record):
    # 解析讀入的一個樣例
    features = tf.parse_single_example(
        record,
        features={
            ‘feat1‘: tf.FixedLenFeature([], tf.int64),
            ‘feat2‘: tf.FixedLenFeature([], tf.int64),
        }
    )
    return features[‘feat1‘], features[‘feat2‘]


# 從TFRecord文件創建數據集。
input_files = [‘./input_file1‘, ‘./input_file2‘]
dataset = tf.data.TFRecordDataset(input_files)

# map()函數表示對數據集中的每一條數據進行調用相應方法。使用TFRecordDataset讀出的是二進制的數據。
# 這裏需要通過map()函數來調用parser()對二進制數據進行解析。類似的，map()函數也可以用來完成其他的數據預處理工作。
dataset = dataset.map(parser)

# 定義遍歷數據集的叠代器
iterator = dataset.make_one_shot_iterator()

# feat1, feat2是parser()返回的一維int64型張量，可以作為輸入用於進一步的計算。
feat1, feat2 = iterator.get_next()

with tf.Session() as sess:
    for i in range(10):
        f1, f2 = sess.run([feat1, feat2])
        print(f1, f2)

運行結果：

技術分享圖片 ?

數據是TFRecord文件：創建數據集。（使用placeholder和initializable_iterator來動態初始化數據集）

#!/usr/bin/env python
# -*- coding: UTF-8 -*-
# coding=utf-8 

"""
@author: Li Tian
@contact: [email protected]
@software: pycharm
@file: dataset_test4.py
@time: 2019/2/10 13:44
@desc: 用initializable_iterator來動態初始化數據集的例子
"""

import tensorflow as tf
from figuredata_deal.dataset_test3 import parser


# 解析一個TFRecord的方法。與上面的例子相同不再重復。
# 從TFRecord文件創建數據集，具體文件路徑是一個placeholder，稍後再提供具體路徑。
input_files = tf.placeholder(tf.string)
dataset = tf.data.TFRecordDataset(input_files)
dataset = dataset.map(parser)

# 定義遍歷dataset的initializable_iterator
iterator = dataset.make_initializable_iterator()
feat1, feat2 = iterator.get_next()

with tf.Session() as sess:
    # 首先初始化iterator，並給出input_files的值。
    sess.run(iterator.initializer, feed_dict={input_files: [‘./input_file1‘, ‘./input_file2‘]})

    # 遍歷所有數據一個epoch，當遍歷結束時，程序會拋出OutOfRangeError
    while True:
        try:
            sess.run([feat1, feat2])
        except tf.errors.OutOfRangeError:
            break

運行結果：

技術分享圖片 ?

TensorFlow數據集（一）——數據集的基本使用方法

cor mark get-data 註意輸入輸出 create amp lose urn 參考書《TensorFlow：實戰Google深度學習框架》（第2版）例子：從一個張量創建一個數據集，遍歷這個數據集，並對每個輸入輸出y = x^2 的值。 #!/usr/

茄子快傳數據分析（一）----數據清理

min 數據解析 dsm clear eas driver user 中國 count 茄子快傳數據分析（一）----數據清理 2018年09月03日 18:41:44 amin_hui 閱讀數：117 茄子快傳原理流程

使用tensorflow訓練自己的資料集（一）——製作資料集

使用tensorflow訓練自己的資料集—製作資料集想記錄一下自己製作訓練集並訓練的過、希望踩過的坑能幫助後面入坑的人。本次使用的訓練集的是kaggle中經典的貓狗大戰資料集（提取碼：ufz5）。因為本人筆記本配置很差還不是N卡所以把train的資料分成了訓練集和測試集並沒有使用

React-native數獨遊戲（一）數獨生成與校驗

react-native還是蠻火的，前面用它做了一個火車票查詢的，感覺還可以，繼續研究，寫了這個數獨小遊戲，和大家分享一下。 github原始碼地址第一部分是關於數獨生成的部分，數獨規則很簡單，行列都沒有重複，每個九宮格也不能重複，演算法也是依照此規則

【數據庫】MySQL數據庫（一）

管理系統 ins 我的電腦使用語句命令行 mar alt rac 一、MySQL數據庫系統 MySQL數據庫系統就是用來對數據庫、數據的一些管理二、數據庫系統 1.數據庫就是用來存儲各種數據的 2.數據庫管理系統就是用來管理各種數據庫的數據的一個系統

項目優化經驗分享（一）數據自己主動匹配

als 主動 options option reg shee total tomat 功能從今天開始。我將和大家分享一下近期經手項目的優化經驗。今天我們分享的內容是：自己主動匹配！引言：輸入框數據自己主動匹配大家應該非常熟悉，當我們在使用百度或go

數據結構（一）之鏈表

存儲鏈表操作 author void 復雜 pac 部分地址插入一、鏈表　　鏈表是一種物理存儲單元上非連續、非順序的存儲結構，數據元素的邏輯順序是通過鏈表中的指針鏈接次序實現的。　　鏈表由一系列結點（鏈表中每一個元素稱為結點）組成，結點可以在運行時動態生成。每個

算法導論筆記——第十~十一章數據結構（一）散列

發生情況要求 sub 裝載 ted 因子 let 完全第十章基本數據結構棧：可由數組表示隊列：可由數組表示指針和對象：可由多數組表示。可用棧表示free list 有根數：　　二叉樹：左右孩子　　分支無限制：左孩子右兄弟表示法第十一章散列表數組：

Python數據結構（一）字典

字典0x 01 字典簡介子典和列表是python中最常用的兩種數據類型，字典是鍵值對(key-value)格式的數據類型，它和列表一樣也有索引，但不是列表中的下標，而是使用key來作為索引，key所對應的值就是value，所以字典是無序的，因此任何時候只要訪問字典的key，便可以得到對應的value，

數據庫筆記（一）--數據庫基礎

sel -s style lan pri ati mys esc 常用一、語法要求 1、SQL語句可以單行或多行書寫，以分號結尾。 2、可以用空格和縮進來來增強語句的可讀性。 3、關鍵字不區別大小寫，建議使用大寫。二、語句分類 1、DDL（Data De

數據結構與算法解析（一）——數據結構與算法簡介

數據結構數據結構與算法解析（一）——數據結構與算法簡介本系列博客為學習狄泰學院《數據結構實戰開發教程》筆記並根據網絡資料總結而來。一、數據結構簡介數據結構是相互間存在特定關系的數據的集合，分為邏輯結構和物理結構。1、邏輯結構集合結構：數據元素之間沒有特別的關系，僅同屬相同集合。線性結構

[讀書筆記] Python數據分析（一）準備工作

基礎 htm 環境防止功能多維處理工具 ati 增強 1. python中數據結構：矩陣，數組，數據框，通過關鍵列相互聯系的多個表（SQL主鍵，外鍵），時間序列 2. python 解釋型語言，程序員時間和CPU時間衡量，高頻交易系統 3. 全局解釋器鎖GIL，

如何“謹慎”使用“數據驅動”的風控模型（一）-- 數據篇

數據驅動數據分析人工智能數據質量如何“謹慎”使用“數據驅動”的風控模型（一）-- 數據篇人工智能時代來臨，2017年“數據驅動”在整個信貸生態圈熱度陡增，無論是金融機構、助貸機構、征信機構、大數據廠商等，無不在各大論壇、峰會、沙龍、融資中宣傳各自“數據驅動”的理

數據聚合（一）

ref 過去的 div 觀測 ive -a 由於默認會有在統計學中，聚合的定義指使用基於多組觀測結果的總結的統計替換多組觀測結果 -- 來自 https://web.archive.org/web/20120112062156/http://www.r-blogg

數據庫（一），範式

兩個 direct alt 反範式還需二維查詢 block 表拆分範式為什麽要用範式我們在學習關系型數據庫的時候一定有感覺，關系數據庫不就是一個二維表格嗎，那麽數據庫有什麽用？數據庫看上去像一個表格，其實不然，比如如下的訂單表，一個訂單號X2001對應一個用戶

使用XStream解析復雜XML並插入數據庫（一）

針對很多 trac ota print root parser 沒有 jdbc 環境： Springboot+mysql 我只想說jpa真的超級好用，準備深入研究一下~ 導入依賴： <dependency> <groupId>org.proj

數據結構與算法（一）--數組

gpo fin ole max htm 算法 lower general print 數組數組是應用最廣泛的數據存儲結構。它被植入到大部分的編程語言中，由於數組十分易懂，所以在這裏就不贅述，主要附上兩端代碼，一個是普通的數組，另一個是有序數組。有序數組是按關鍵字升序（或降

MongoDB入門（一）——數據庫概述

數據庫非關系型數據庫 MongoDB 1.數據庫概述1.1.引言以上圖片是什麽？答案：車庫車庫用來做什麽？答案：停放車輛，換句話說：存儲汽車。數據庫用來做什麽？答案：存儲數據。思考1：老師讓你匯總下本周遲到人數，你如何記錄？數據量比較小，用一個excel表格就存放遲到人的名單。思考2：

Redis的數據結構（一）

惰性 api rim 緩沖可能過程 edi strong body （一）使用SDS（simple dynamic string）簡單動態字符串。好處： 1.可以杜絕緩沖區溢出。--->SDS API在修改SDS時會進行空間判斷，【空間不足會自動擴充-->

Exchange 2013數據庫可移植性恢復用戶數據庫（一）

服務器 Exchange 案例講述：我目前環境中有一套Exchagne01和Exchange02服務器，全部是全角色安裝的exchange2013CU8的系統。這兩臺服務器同屬一個DAG組，由於特殊原因DAG的故障轉移群集出現問題，無法正常恢復，導致用戶郵箱不能訪問。目前發現Exchange01上的數

TensorFlow數據集（一）——數據集的基本使用方法

參考書

運行結果：

運行結果：

運行結果：

運行結果：

運行結果：

相關推薦