Cifar-10資料集的視覺化儲存

阿新 • • 發佈：2018-12-09

學習Tensorflow或深度學習，難免用到各種資料集，最近用到cifar10資料集，簡單研究了下，然後把cifar-10資料集儲存為jpg圖片，分別利用python和c++做了實現。

關於cifar-10，網上介紹很多，這裡主要用了python和binary版本：

python版

每個batch包含一個字典，該字典有data和labels兩個key。其中，data是1000*3072（ 3 *32 *32）的影象資料。1000即圖片數量，前1024個數據是red通道畫素值，然後1024是個green通道畫素值，最後啥blue通道。labels是1000個0~9表示資料類別的資料。

程式碼如下：

import numpy as np
from PIL import Image
import pickle
import os

CHANNEL = 3
WIDTH = 32
HEIGHT = 32

data = []
labels=[]
classification = ['airplane','automobile','bird','cat','deer','dog','frog','horse','ship','truck']

for i in range(5):
    with open("data/cifar-10-batches-py/data_batch_"+ str(i+1),mode='rb') as file:
        data_dict = pickle.load(file, encoding='bytes')
        data+= list(data_dict[b'data'])
        labels+= list(data_dict[b'labels'])

img =  np.reshape(data,[-1,CHANNEL, WIDTH, HEIGHT])


data_path = "data/images/"
if not os.path.exists(data_path):
    os.makedirs(data_path)
for i in range(img.shape[0]):

    r = img[i][0]
    g = img[i][1]
    b = img[i][2]

    ir = Image.fromarray(r)
    ig = Image.fromarray(g)
    ib = Image.fromarray(b)
    rgb = Image.merge("RGB", (ir, ig, ib))

    name = "img-" + str(i) +"-"+ classification[labels[i]]+ ".png"
    rgb.save(data_path + name, "PNG")

結果截圖：

C++版

每個batch包括10000*（1 + 3072）大小資料，1代表label大小，3072是影象資料。儲存方式同上。

程式碼如下：

#include<iostream>
#include<opencv2/opencv.hpp>

using namespace std;
using namespace cv;

#define WIDTH 32
#define HEIGHT 32
#define CHANNEL 3
#define PERNUM 1000 
#define CLASS 10


char classification[CLASS][256] = { "airplane", "automobile", "bird", "cat", "deer", "dog", "frog", "horse", "ship", "truck" };

int main(){

	FILE *pBatch = fopen("data_batch_1.bin","rb");
	if (!pBatch)
		return -1;

	unsigned char buf[CHANNEL * WIDTH * HEIGHT + 1];
	memset(buf,0,sizeof(buf));
	Mat bgr;
	bgr.create(WIDTH,HEIGHT,CV_8UC3);

	int index = 0;
	while (!feof(pBatch)){
		
		fread(buf, 1, CHANNEL * WIDTH * HEIGHT + 1, pBatch);
		unsigned char* pBuf = buf + 1;

		for (int i = 0; i < bgr.rows;i++){

			Vec3b *pbgr = bgr.ptr<Vec3b>(i);
			
			for (int j = 0; j < bgr.cols;j++){
				//pBuf += (i * bgr.rows + j * bgr.cols);
				
				for (int c = 0; c < 3;c++){

					pbgr[j][c] = pBuf[(2 - c)* bgr.rows * bgr.cols + i * bgr.rows + j ];
				}

			}
		}
		
		imwrite("image/img" + to_string(index)+".jpg",bgr);
		index++;
	}

	fclose(pBatch);
	return 0;
}

結果截圖：

Cifar-10資料集的視覺化儲存

學習Tensorflow或深度學習，難免用到各種資料集，最近用到cifar10資料集，簡單研究了下，然後把cifar-10資料集儲存為jpg圖片，分別利用python和c++做了實現。關於cifar-10，網上介紹很多，這裡主要用了python和binar

計算機視覺（八）：提取Cifar-10資料集的HOG、HSV特徵並使用神經網路進行分類

1 - 引言之前我們都是將整張圖片輸入進行分類，要想進一步提升準確率，我們就必須提取出圖片更容易區分的特徵，再將這些特徵當做特徵向量進行分類。在之前我們學了一些常用的影象特徵，在這次實驗中，我們使用了兩種特徵梯度方向直方圖（HOG）顏色直方圖（HSV）

計算機視覺（七）：構建兩層的神經網路來分類Cifar-10資料集

1 - 引言之前我們學習了神經網路的理論知識，現在我們要自己搭建一個結構為如下圖所示的神經網路，對Cifar-10資料集進行分類前向傳播比較簡單，就不在贅述反向傳播需要注意的是，softmax的反向傳播與之前寫的softmax程式碼一樣。神經網路內部的反向傳播權重偏導就是前面

計算機視覺（六）：使用Softmax分類Cifar-10資料集

1 - 引言這次，我們將使用Softmax來分類Cifar-10，過程其實很之前使用的SVM過程差不多，主要區別是在於損失函式的不同，而且Softmax分類器輸出的結果是輸入樣本在不同類別上的概率值大小,Softmax分類器也叫多項Logistic迴歸線性模型:

計算機視覺（五）：使用SVM分類Cifar-10資料集

1 - 引言之前我們使用了K-NN對Cifar-10資料集進行了圖片分類，正確率只有不到30%，但是還是比10%高的[手動滑稽]，這次我們將學習使用SVM分類器來對Cafi-10資料集實現分類，但是正確率應該也不會很高要想繼續提高正確率，就要對影象進行預處理和特徵的選取工作，而不

關於cifar-10資料集讀取問題

資料集下載後是特定格式，需要編寫函式進行讀取。讀取後是dict格式，有4個鍵及其對應的若干值，如何準確讀取並修改影象維度，使用reshape會發現資料錯亂。每個檔案中資料儲存格式為dict字典，鍵值為b’data’的為圖片資料，是一個10000 * 3072（32 * 32 * 3）

深度學習之TensorFlow使用CNN測試Cifar-10資料集（Python實現）

題目描述： 1. 對Cifar-10影象資料集，用卷積神經網路進行分類，統計正確率。 2.選用Caffe, Tensorflow, Pytorch等開源深度學習框架之一，學會安裝這些框架並呼叫它們的介面。 3.直接採用這些深度學習框架針對Cifar-10資料集已訓練好的網路模型，只

機器學習學習筆記：用MiniVGGNet處理Cifar-10資料集

0. 引言 VGGNet，由Simonyan和Zisserman在2014年提出，論文名字是《Very Deep Learning Convolutional Neural Networks for Large-Scale Image Recognition》。他們做出的貢

深度學習入門——利用卷積神經網路訓練CIFAR—10資料集

CIFAR-10資料集簡介 CIFAR-10是由Hinton的學生Alex Krizhevsky和Ilya Sutskever整理的一個用於普適物體的小型資料集。它一共包含10個類別的RGB彩色圖片：飛機、汽車、鳥類、貓、鹿、狗、蛙類、馬、船：資料集包含50000張訓練圖片和1000

vs2017 VGG19處理cifar-10資料集--更進一步的學習tensorflow相關知識

這是針對於部落格vs2017安裝和使用教程（詳細）的VGG19-CIFAR10專案新建示例目錄一、程式碼(附有重要的註釋) 二、專案結構三、VGG簡介四、程式執行關鍵部分解析五、訓練過程和結果六、參考部落格和文獻一、程式碼(附有重要的註釋)

【python資料探勘課程】十九.鳶尾花資料集視覺化、線性迴歸、決策樹花樣分析

這是《Python資料探勘課程》系列文章，也是我這學期上課的部分內容。本文主要講述鳶尾花資料集的各種分析，包括視覺化分析、線性迴歸分析、決策樹分析等，通常一個數據集是可以用於多種分析的，希望這篇文章對大

MNIST 資料集視覺化程式碼

寫一個matlab小程式將mnist資料集視覺化，將以下程式碼命名為image_visualization 並放在 $caffe_root/data/mnist/ 下，{獨立執行，不必編譯caffe，但是要提前Linux下下載資料} clear; clc; cle

windows下TensorFlow中匯入cifar-10資料集時出現的錯誤/git clone錯誤

Windows環境下TensorFlow中匯入cifar-10資料集時出現的錯誤error:RPC failed;curl 56 OpenSSL SSL_read:SSL_ERROR_SYSCALL,errno 10054ffatal:early EOFatal:The re

Tensorflow深度學習之二十一：LeNet的實現（CIFAR-10資料集）

一、LeNet的簡介 LeNet是一個用來識別手寫數字的最經典的卷積神經網路，是Yann LeCun在1998年設計並提出的。Lenet的網路結構規模較小，但包含了卷積層、池化層、全連線層，他們都構成了現代CNN的基本元件。 LeNet包含輸入層在內共有

Tensorflow深度學習之二十二：AlexNet的實現（CIFAR-10資料集）

二、工程結構由於我自己訓練的機器記憶體視訊記憶體不足，不能一次性讀取10000張圖片，因此，在這之前我按照圖片的類別，將每一張圖片都提取了出來，儲存成了jpg格式。與此同時，在儲存圖片的過程中，儲存了一個python的dict結構，鍵為每一張圖片的相對地

TensorFlow學習－－卷積神經網路訓練CIFAR-10資料集

CIFAR-10資料集 CIFAR-10資料集包含10個類的60000張32x32的彩色影象，每個類有6000張影象。有50000張訓練影象和10000張測試影象。 10個分類明細及對應的部分圖片：卷積神經網路訓練CIFAR-10資料集

Python3讀取深度學習CIFAR-10資料集出現的若干問題解決

　　今天在看網上的視訊學習深度學習的時候，用到了CIFAR-10資料集。當我興高采烈的執行程式碼時，卻發現了一些錯誤： # -*- coding: utf-8 -*- import pickle as p import numpy as np import o

KNN實現CIFAR-10資料集識別

KNN缺點：每個測試樣本都要迴圈一遍訓練樣本。該資料集由5個data_batch和一個test_batch構成，測試程式碼 import pickle import numpy as np fo=open('./datasets/cifar-10-batch

[keras實戰] 小型CNN實現Cifar-10資料集84%準確率

實驗環境程式碼基於python2.7, Keras1（部分介面在Keras2中已經被修改，如果你使用的是Keras2請查閱文件修改介面）個人使用的是蟲資料提供的免費GPU主機，GTX1080顯示卡，因為是免費賬號，所以視訊記憶體最高只有1G。為了防止超視

CIFAR10資料集取一張視覺化儲存

transform = transforms.Compose([ transforms.Resize(96), transforms.ToTensor()

Cifar-10資料集的視覺化儲存

python版

C++版

相關推薦