TensorFlow學習筆記(10) 影象資料處理

阿新 • • 發佈：2018-12-12

通過對影象的預處理，可以避免模型受到無關因素的影響，可以提高模型的準確率。

影象編碼處理

影象在儲存時並不是直接記錄影象矩陣中各個畫素值，而是記錄經過壓縮編碼之後的結果。將一張影象還原成矩陣，需要解碼的過程。TF提供了對jpeg和png格式影象的編碼/解碼函式：

import matplotlib.pyplot as plt
import tensorflow as tf

#讀取原始影象資料
image_raw_data = tf.gfile.FastGFile('picture.jpeg', 'rb').read()

with tf.Session() as sess:
    #tf.image.decode_jpeg對jpeg影象進行解碼
    #tf.image.decode_png對png影象進行解碼，結果均為一張量
    img_data = tf.image.decode_jpeg(image_raw_data)
    print(sess.run(img_data))

    plt.imshow(sess.run(img_data))
    plt.show()

    #轉換資料型別為實數方便處理
    img_data = tf.image.convert_image_dtype(img_data, dtype=tf.float32)

    #編碼為jpeg格式    
    img_data = tf.image.convert_image_dtype(img_data, dtype=tf.uint16)
    encode_img = tf.image.encode_jpeg(img_data)
    with tf.gfile.FastGfile('picture_out.png', 'wb') as f:
        f.write(sess.run(encode_img))

影象大小調整

影象大小的調整有兩種方式，第一種是通過演算法使得新的影象儘量儲存原始影象上的資訊。

#img_data是已經經過解碼且進行型別轉化的資料

#第二個第三個引數為調整後圖像的大小
#method=0   採用雙線性插值法
#method=1   採用最近鄰居法
#method=2   採用雙三次插值法
#method=3   採用面積插值法
resized = tf.image.resize_images(img_data, [300, 300], method=0)

TF也提供了對影象進行裁剪或填充的方法。

#通過tf.image.resize_image_with_crop_or_pad可以實現影象的裁剪和填充
#如果給定尺寸比原圖大則填充，否則裁剪原圖居中部分
croped = tf.image.resize_image_with_crop_or_pad(img_data, [1000, 1000])
padded = tf.image.resize_image_with_crop_or_pad(img_data, [3000, 3000])

另外tf.image.crop_to_bounding_box函式和tf.image.pad_to_bounding_box函式可以用來剪裁或填充給定區域的影象。

影象翻轉

以下程式碼實現影象上下翻轉、左右翻轉以及對角線翻轉。

    fliped = tf.image.flip_up_down(img_data)
    fliped = tf.image.flip_left_right(img_data)

    transposed = tf.image.transpose_image(img_data)

通過隨機翻轉訓練影象的方式可以使得訓練得到的模型可以識別不同角度的實體：

    fliped = tf.image.random_flip_up_down(img_data)
    fliped = tf.image.random_flip_left_right(img_data)

影象色彩調整

#亮度-0.5 及 +0.5
adjusted = tf.image.adjust_brightness(img_data, -0.5)
adjusted = tf.image.adjust_brightness(img_data, +0.5)
#在[-x，x]範圍內隨機調整亮度
adjusted = tf.image.random_brightness(img_data, x)

#對比度-0.5 及 +0.5
adjusted = tf.image.adjust_contrast(img_data, -0.5)
adjusted = tf.image.adjust_contrast(img_data, +0.5)
#在[x，y]範圍內隨機調整對比度
adjusted = tf.image.random_contrast(img_data, x, y)

#色相 +0.1  及 +0.5
adjusted = tf.image.adjust_hue(img_data, 0.1)
adjusted = tf.image.adjust_hue(img_data, 0.5)
#在[-x，x]範圍內隨機調整色相
adjusted = tf.image.random_hue(img_data, x)

#飽和度 -0.5 及 +0.5
adjusted = tf.image.adjust_saturation(img_data, -0.5)
adjusted = tf.image.adjust_saturation(img_data, 0.5)
#在[-x，x]範圍內隨機調整飽和度
adjusted = tf.image.random_saturation(img_data, x, y)

#將影象變為均值為0方差為1的影象(二值圖?)
adjusted = tf.image.per_image_standardization(img_data)

處理標註框

TF提供了一些工具來標註影象中需要關注的物體，使用tf.image.draw_bounding_boxes可以在影象中加入標註框。

    img_data = tf.image.resize_images(img_data, [108, 192], method=0)
    #由於tf.image.draw_bounding_boxes函式輸入影象為一個四維矩陣，所以解碼之後要加一維，其中第一維度表示第幾張圖片
    batched = tf.expand_dims(tf.image.convert_image_dtype(img_data, tf.float32), 0)
    #給出影象的標註框,一個標註框有四個數字，分別代表[ymin,xmin,ymax,xmax],其中數字都代表其相對位置
    boxes = tf.constant([[[0.1, 0.2, 0.9, 0.7], [0.35, 0.47, 0.5, 0.56]]])
    result = tf.image.draw_bounding_boxes(batched, boxes)

    plt.imshow(sess.run(result[0]))
    plt.show()

另外，也可以通過tf.image.sample_distorted_bounding_box函式實現影象的隨機擷取，這樣可以提高模型的robustness，不受被識別物體大小的影響。

    boxes = tf.constant([[[0.1, 0.2, 0.9, 0.7], [0.35, 0.47, 0.5, 0.56]]])
    #通過提供標註框的方式來限定隨機擷取的範圍
    begin, size, bbox_for_draw = tf.image.sample_distorted_bounding_box(tf.shape(img_data), bounding_boxes=boxes)
    batched = tf.expand_dims(tf.image.convert_image_dtype(img_data, tf.float32), 0)
    #繪製標註框
    image_with_box = tf.image.draw_bounding_boxes(batched, bbox_for_draw)
    #提取截圖切片
    distorted_image = tf.slice(img_data, begin, size)

TensorFlow學習筆記(10) 影象資料處理

通過對影象的預處理，可以避免模型受到無關因素的影響，可以提高模型的準確率。影象編碼處理影象在儲存時並不是直接記錄影象矩陣中各個畫素值，而是記錄經過壓縮編碼之後的結果。將一張影象還原成矩陣，需要解碼的過程。TF提供了對jpeg和png格式影象的編碼/解碼函式： import matplotl

tensorflow學習筆記1:影象資料的一些簡單操作

博主學習TensorFlow不久，學習路上也是遇到不少問題。所以決定寫一個系列的學習筆記，算是記錄下學習歷程，方便以後翻閱。當然如果可以幫助到一些新手的話就更好了，高手請繞道。 1.影象資料的採集: &nbs

機器學習筆記（十八）：TensorFlow實戰十（影象資料處理）

1 - 引言之前我們介紹了通過卷積神經網路可以給影象識別技術帶來突破性的進展，現在我們從影象的預處理這個角度來繼續提升我們影象識別的準確率。輸入的預處理需要使用TFRecord格式來同一不同的原始資料格式，並且更加有效的管理不同的屬性。並且TensorFlow支援影象處理函式，

[TensorFlow]入門學習筆記(3)-影象預處理

影象預處理前言因為在做目標追蹤方面，一直在matlab中寫程式碼，不得不說改程式碼改的又複雜又難改，優化難做啊。就把影象預處理過程直接放到tensorflow中學習吧。 TFRecord資料格式對於資料量較小而言，可能一般選擇直接將資料載入進記憶體

TensorFlow學習筆記-組合訓練資料

　　Tensorflow資料預處理操作：http://blog.csdn.net/lovelyaiq/article/details/78716325 　　Tensorflow讀出TFRecord中的資料，然後在經過預處理操作，此時需要注意：資料還是單個，而

tensorflow學習筆記——影象資料處理

　　喜歡攝影的盆友都知道影象的亮度，對比度等屬性對影象的影響是非常大的，相同物體在不同亮度，對比度下差別非常大。然而在很多影象識別問題中，這些因素都不應該影響最後的結果。所以本文將學習如何對影象資料進行預處理使訓練得到的神經網路模型儘可能小地被無關因素所影響。但與此同時，複雜的預處理過程可能導致訓練效率的下降

機器學習學習筆記：用MiniVGGNet處理Cifar-10資料集

0. 引言 VGGNet，由Simonyan和Zisserman在2014年提出，論文名字是《Very Deep Learning Convolutional Neural Networks for Large-Scale Image Recognition》。他們做出的貢

tensorflow學習（10）：影象處理函式

一、影象編碼處理眾所周知，一張RGB彩色想可以看成一個三維矩陣，矩陣中的每一個數字表示了影象上不同位置，不同顏色的亮度。但是影象在儲存時不是直接記錄這些距震中的數字，而是記錄經過壓縮編碼之後的結果，因此要將一張影象還原成一個三維矩陣，需要解碼。tensorflow提供了對JPEG和PN

Caffe學習筆記10：影象資料生成caffe需要的（laveldb和lmdb）資料檔案

在深度學習的實際應用中，我們經常用到的原始資料是圖片檔案，如jpg,jpeg,png,tif等格式的，而且有可能圖片的大小還不一致。而在caffe中經常使用的資料型別是lmdb或lev

《TensorFlow學習筆記》對圖片資料的預處理一、-編碼解碼調整大小色彩亮度

IDE：pycharm Python: Python3.6 OS: win10 tf： 1.5.0 圖片資料的預處理所謂，預處理就是對訓練圖片提前進行一些處理，為什麼要這麼幹呢？？答案是為了降低其他無關因素對最後的識別結果的影響，比如說一幅

《TensorFlow學習筆記》對圖片資料的預處理二、畫標註框，預處理完整框架

IDE：pycharm Python: Python3.6 OS: win10 前提如果您只是來看畫標註框的話也只需要看這一篇文章即可，會有一個很詳細的介紹和使用，但是你如果想學習整體的預處理請您看我的上一篇博文《TensorFlow學習筆記

Tensorflow學習筆記-輸入資料處理框架

Created with Raphaël 2.1.0獲取輸入檔案列表建立輸入檔案佇列從檔案佇列讀取資料整理成Batch作為神經網路的輸入設計損失函式選擇梯度下降法訓練　　對應的程式碼流程如下： # 建立檔案列表，並通過檔案列表來建立檔案佇列

tensorflow學習筆記——多執行緒輸入資料處理框架

　　之前我們學習使用TensorFlow對影象資料進行預處理的方法。雖然使用這些影象資料預處理的方法可以減少無關因素對影象識別模型效果的影響，但這些複雜的預處理過程也會減慢整個訓練過程。為了避免影象預處理成為神經網路模型訓練效率的瓶頸，TensorFlow提供了一套多執行緒處理輸入資料的框架。　　下面總結了

MySQL學習筆記10復制錯誤處理(一)表已存在的問題

opp upd char execute set 現在 try state error: (1)錯誤情況在slave上已經有數據表test，而master上並沒有這張表，現在在master上新建test表，則slave上的復制過程會出錯。 MySQL的log記錄中相關信息

tensorflow學習筆記(北京大學) tf5_1minst_forward.py 完全解析 mnist資料集

#coding:utf-8 #tensorflow學習筆記(北京大學) tf5_1minst_forward.py 完全解析 mnist資料集 #QQ群：476842922（歡迎加群討論學習 import tensorflow as tf #網路輸入節點為784個（代表每張輸入圖片的畫素個

（print除去省略號）tensorflow學習筆記(北京大學) tf4_1_0.py 完全解析列印完整資料

# -*- coding: utf-8 -*- """ Created on Thu Nov 1 12:24:34 2018 #tensorflow學習筆記(北京大學) tf3_7_0.py 完全解析列印完整資料 #QQ群：476842922（歡迎加群討論學習 """ import te

nodejs學習筆記——使用buffer類處理二進位制資料

1. 建立buffer物件：new Buffer(size) buf.fill(value,[offset],[end])第一個引數指需要被寫入的值，第二個引數指定從第幾個位元組處開始寫入被指定的數值，預設為0。第三個引數是指定將數值一直寫到第幾位元組處，預設Buffer物件的大小。其中n

誰說菜鳥不會資料分析（工具篇）----- 學習筆記3（資料準備、處理）

1、資料準備：一維表的列標籤是欄位，二維表的列標籤是資料資料表的設計要求資料表由標題行和資料部分組成第一行是標的列標題（欄位名），列標題不能重複第二行是資料部分，資料部分的每一行資料稱為一個記錄，並且資料部分不允許出現空白行和空白列

TensorFlow學習筆記(9) TFRecord 輸入資料格式

TF提供了一種統一的格式來儲存資料，這個格式就是TFRecord。TFRecord檔案中的資料都是通過tf.train.Example Protocol Buffer的格式儲存的。tf.train.Example中包括一個從屬性名稱到取值的字典。其中屬性名稱為一個字串，取值為字串、實數列表或者整數列

Tensorflow學習筆記：資料集加工和轉化為TensorFlow專用格式——Finetuning，貓狗大戰，VGGNet的重新針對訓練

Kaggle 貓狗大戰貓狗大戰的資料集來源於Kaggle上的一個競賽：Dogs vs. Cats 貓狗大戰的資料集下載地址http://www.kaggle.com/c/dogs-vs-cats，其中資料集有12500只貓和12500只狗 ,官方資料集下載需要帳號，大

TensorFlow學習筆記(10) 影象資料處理

相關推薦