TensorFlow——訓練自己的資料——CIFAR10（一）資料準備

阿新 • • 發佈：2019-01-24

Reading Data
所用函式

def read_cifar10(data_dir, is_train, batch_size, shuffle):`
    Args:
        data_dir: the directory of CIFAR10
        is_train: boolen
        batch_size:
        shuffle:   #是否打亂順序   
    Returns:
        label: 1D tensor, tf.int32
        image: 4D tensor, [batch_size, height, width, 3 
], tf.float32

變數宣告

img_width = 32
img_height = 32
img_depth = 3
label_bytes = 1
image_bytes = img_width*img_height*img_depth #32x32x3=3072

讀取資料

#將以下操作放在一個作用域內，使得tensorboard更美觀
    with tf.name_scope('input'):

        #如果是訓練資料，則將檔案的路徑賦值給filenames，注意到data的命名規律為data_batch_n.bin
        #os.path.join(“home”, "me", "mywork"),在linux返回“home/me/mywork"，在windows上返回"home\me\mywork" 

        #好處是可以根據系統自動選擇正確的路徑分隔符"/"或"\"
        if is_train:
            filenames = [os.path.join(data_dir, '/data_batch_%d.bin' %ii)
                                        for ii in np.arange(1, 5)]
        else:
            filenames = [os.path.join(data_dir, '/test_batch.bin')]

        #產生一個佇列，因為使用的是二進位制，所以使用string_input_producer 

        #ps:之前貓狗大戰是label+img,用的是slice_input_producer
        filename_queue = tf.train.string_input_producer(filenames)
        #讀取資料，label_bytes=1，image_bytes=32*32*3=3072
        reader = tf.FixedLengthRecordReader(label_bytes + image_bytes)

        key, value = reader.read(filename_queue)
        #對讀取到的資料解碼decode   
        #ps：貓狗大戰的資料是img，用的解碼器是tf.image.decode_jpeg
        record_bytes = tf.decode_raw(value, tf.uint8)
        #data包含了label和image，所以通過slice切片，把他們分開，這裡切了個[0,1]
        label = tf.slice(record_bytes, [0], [label_bytes])   
        label = tf.cast(label, tf.int32)
        #切[1,3072]
        image_raw = tf.slice(record_bytes, [label_bytes], [image_bytes])
        #將二進位制資料reshape為影象資料[0-depth,1-height,2-width]=[3,32,32]
        image_raw = tf.reshape(image_raw, [img_depth, img_height, img_width])
        #轉換為[1-height,2-width,0-depth]
        image = tf.transpose(image_raw, (1,2,0)) # convert from D/H/W to H/W/D       
        image = tf.cast(image, tf.float32)


#        # data argumentation,影象增強（裁剪、旋轉、縮放等），但據說效果不怎麼樣

#        image = tf.random_crop(image, [24, 24, 3])# randomly crop the image size to 24 x 24
#        image = tf.image.random_flip_left_right(image)
#        image = tf.image.random_brightness(image, max_delta=63)
#        image = tf.image.random_contrast(image,lower=0.2,upper=1.8)


        #歸一化操作從[0,255]到[-1,1]
        image = tf.image.per_image_standardization(image) #substract off the mean and divide by the variance 

        #是否打亂順序
        if shuffle:
            images, label_batch = tf.train.shuffle_batch(
                                    [image, label], 
                                    batch_size = batch_size,
                                    num_threads= 16,
                                    capacity = 2000, #佇列的容量
                                    min_after_dequeue = 1500)#佇列取出後的最小值
        else:
            images, label_batch = tf.train.batch(
                                    [image, label],
                                    batch_size = batch_size,
                                    num_threads = 16,
                                    capacity= 2000)

#        return images, tf.reshape(label_batch, [batch_size])

## ONE-HOT ，將label轉換成[1,0,0,0,0,0,0,0,0,0]的形式（第一個類為正確）     
        n_classes = 10
        label_batch = tf.one_hot(label_batch, depth= n_classes)
        return images, tf.reshape(label_batch, [batch_size, n_classes])

測試資料
把一個Batch顯示出來

import matplotlib.pyplot as plt
#這裡用自己的data路徑
data_dir = 'D:/Study/Python/Projects/CIFAR10/data'
BATCH_SIZE = 2  #一個batch兩張圖
image_batch, label_batch = read_cifar10(data_dir,
                                        is_train=True,
                                        batch_size=BATCH_SIZE, 
                                        shuffle=True)

with tf.Session() as sess:
    i = 0
    #用coord和threads監控佇列
    coord = tf.train.Coordinator()
    threads = tf.train.start_queue_runners(coord=coord)

    try:
        while not coord.should_stop() and i<1:

            img, label = sess.run([image_batch, label_batch])

            # just test one batch
            for j in np.arange(BATCH_SIZE):
                print('label: %d' %label[j])
                plt.imshow(img[j,:,:,:])
                plt.show()
            i+=1

    except tf.errors.OutOfRangeError:
        print('done!')
    finally:
        coord.request_stop()
    coord.join(threads)

結果
歸一化和float型別導致圖片顯示失真
這裡寫圖片描述

TensorFlow——訓練自己的資料——CIFAR10（一）資料準備

Reading Data 所用函式 def read_cifar10(data_dir, is_train, batch_size, shuffle):` Args: data_dir: the directory of CI

資料結構（一）——資料結構初識及演算法複雜度介紹

資料結構，毋庸置疑，在程式設計中是極其重要的存在，在電腦科學中，不只是一般程式設計的基礎，而且是設計和實現編譯程式、作業系統、資料庫系統及其他系統程式和大型應用程式的重要基礎。因此，CSDN的第一篇文章就選擇了資料結構（也是打算再次補習可

資料加工（一）-------資料抽取

資料抽取（1）欄位分列：擷取某一欄位的部分資訊（2）欄位合併：將某幾個欄位合併為一個新欄位（3）欄位匹配：將原資料表沒有，但其他資料表中有的欄位，有效地匹配過來。（一）欄位分列（1）選單法： 1.資料---分列---“文字分列嚮導-第1步”對話方塊中單擊分隔符---單擊下一步按

資料結構（一）:資料結構的基本概念和演算法的時間和空間複雜度

資料結構討論的範疇計算機技術的兩大支柱：1是資料結構，2是演算法。在某種程度上講，程式設計等同於資料結構+演算法。程式設計是為計算機設計一組指令集，演算法是解決問題的策略，資料結構是模型。問

【ML專案】基於網路爬蟲和資料探勘演算法的web招聘資料分析（一）——資料獲取與處理

前言這個專案是在學校做的，主要是想對各大招聘網站的招聘資料進行分析，沒準能從中發現什麼，這個專案週期有些長，以至於在專案快要結束時發現網上已經有了一些相關的專案，我後續會把相關的專案材料放在我的GitHub上面，連結為：https://github.com/

使用tensorflow訓練自己的資料集（一）——製作資料集

使用tensorflow訓練自己的資料集—製作資料集想記錄一下自己製作訓練集並訓練的過、希望踩過的坑能幫助後面入坑的人。本次使用的訓練集的是kaggle中經典的貓狗大戰資料集（提取碼：ufz5）。因為本人筆記本配置很差還不是N卡所以把train的資料分成了訓練集和測試集並沒有使用

使用tensorflow訓練自己的資料集（一）

使用tensorflow訓練自己的資料集想記錄一下自己製作訓練集並訓練的過、希望踩過的坑能幫助後面入坑的人。本次使用的訓練集的是kaggle中經典的貓狗大戰資料集（提取碼：ufz5）。因為本人筆記本配置很差還不是N卡所以把train的資料分成了訓練集和測試集

Tensorflow 訓練自己的資料集（一）（資料直接匯入到記憶體）

製作自己的訓練集下圖是我們資料的存放格式，在data目錄下有驗證集與測試集分別對應iris_test， iris_train 為了向偉大的MNIST致敬，我們採用的資料名稱格式和MNIST類似 classification_index.jpg

FastRCNN 訓練自己資料集（一）——編譯配置

FastRCNN是Ross Girshick在RCNN的基礎上增加了Multi task training整個的訓練過程和測試過程比RCNN快了許多。別的一些細節不展開，過幾天會上傳Fast RCNN的論文筆記。FastRCNN mAP效能上略有上升。Fast RCNN中，提取OP的過程和訓練過程仍

【Tensorflow】怎樣為你的網路預加工和打包訓練資料？（一）

面對五花八門的資料集，各種各樣的資料儲存形式，剛新手入門的我們在處理這些情況的時候是否會手足無措？反正一路走來，我的經驗告訴我，deep learning的實驗階段，資料準備和處理過程往往會讓你碰一鼻子灰。明明知道如何搭建網路，還是完成不了實驗，究其原因，是資料工程經驗的不

自己動手實現java資料結構（一）向量

1.向量介紹　　計算機程式主要執行在記憶體中，而記憶體在邏輯上可以被看做是連續的地址。為了充分利用這一特性，在主流的程式語言中都存在一種底層的被稱為陣列(Array)的資料結構與之對應。在使用陣列時需要事先宣告固定的大小以便程式在執行時為其開闢記憶體空間；陣列通過下標值計算出地址偏移量來對內部元素進行訪問

漢諾塔--Python的資料結構--無聊時候打發自己的時間（一）

這個遊戲的規則很簡單。對於這個遊戲來說最重要的有倆點：1、對於K個（K大於等於1）盤子最少需要多少次搬運，這裡有個關係式，可以用第一數學歸納法證明，自行證明；2、對於確定的次數，每次我們進行的操作具體是怎樣的，或者說給一個具體的操作指南，讓機器知道每次要幹什麼。在這裡我要討論的是第二點。

自己搭建自動化巡檢系統（一）環境準備系統連接gns3

自動化巡檢這系列的博文，講述一個自制的自動巡檢系統，僅僅是在cisco設備中運行，之後會基於這個思路，寫出一個兼容性的通用巡檢系統，傳統網工對網絡設備是非常熟悉的，然而在編程開發這一塊是相對弱勢一點。我在想在SDN的背景下，網工一旦會編程，該有多麽強勢，一些重復執行的步驟，電腦代勞，

Asp.net MVC 搭建屬於自己的框架（一）

C4D pagedlist del tran 6.0 ext 才有應該 frame 網址：https://www.cnblogs.com/sggx/p/4555255.html 為什麽要自己搭框架？　　大家夥別急，讓我慢慢地告訴你！大家有沒有這種感覺，從一家跳槽到另一家

JavaScript 資料結構（一）：連結串列

前言從實用性角度來說，連結串列對Javascript 來說沒有任何價值，為什麼呢？我們先了解連結串列的特性，這個特性我們放在c++前提下來說，因為這個特性是根據記憶體特性來闡述的，Javascript 不存在記憶體操作，所有資料型別，本質性繼承Object 物件，而Ob

前端資料大全（一）

文章目錄前端資料大全（一）第一篇前端工具部落格/社群/資訊各類外掛主流框架手冊/書籍設計/互動第二篇綜合/資源 ca

MySQL從刪庫到跑路_高階（一）——資料完整性

作者：天山老妖S 連結：http://blog.51cto.com/9291927 一、資料完整性簡介 1、資料完整性簡介資料冗餘是指資料庫中存在一些重複的資料，資料完整性是指資料庫中的資料能夠正確反應實際情況。資料完整性是指資料的可靠性和準確性，資料

分散式事務解決資料一致性（一）事務原則與實現：事務、sql事務

事務：定義：是以一種可靠、一致的方式，訪問和操作資料庫中資料的程式單元。原則： *a、原子性 * b、一致性 * c、隔離性 &nbs

everything用於行動硬碟資料管理（一）：離線搜尋

使用【everything檔案搜尋軟體】建立行動硬碟列表，實現離線檔案（夾）搜尋第一步：開啟檔案列表。第二步：另存離線檔案列表 2.1 複製行動硬碟某個分割槽的名稱。 2.2 檔案列表另存為第三步：第一次搜尋，儲存搜尋結

資料結構（一）：什麼是資料結構

一、什麼是資料結構 1、資料結構的定義資料：從計算機的角度來看，資料是所有能被輸入到計算機中且能被計算機處理的符號的集合。它是計算機操作的物件的總稱，也是計算機處理資訊的某種特定的符號表示形式（二進位制碼的抽象表示？）。資料元素：資料元素是資料中的一個個體

TensorFlow——訓練自己的資料——CIFAR10（一）資料準備

相關推薦