將自己數據轉化為cifar10支持的lmdb

阿新 • • 發佈：2017-07-01

顯示 c++ track div ifs cat 自己的 align blog

大家都知道，在caffe裏面，要運行cifar10的例子就得先由cifar10的數據庫。由於caffe為了提高運行效率，減少磁盤尋道時間等，統一了數據接口（lmdb，leveldb）。

首先，看一下cafferoot/data/cifar10（cafferoot指的是自己caffe安裝的根目錄）下面的get_cifar10.sh

技術分享

可見其下載的是bin格式的圖片，然後通過cafferoot/examples/cifar10/create_cifar10.sh將bin文件轉化為lmdb格式。

那麽這樣的問題來了，由於，cifar10由官網提供了2進制的bin文件，如果我們想訓練自己的模型呢？如果我們想加進自己的圖片呢。所以，一個保持和官網cifar10同步的將傳統的jpg、png等格式轉為bin格式的程序應用而生。

進入正題

1，cifar10的bin數據格式

image 的大小為32*32，flag為0-9，共10類，使用的是cifar-10數據集

二進制數據格式為flag,R(1024),G(1024),B(1024),每個通道按行排列

2，讀取cifar10的bin文件，將bin文件中數據轉化為圖片並顯示

[cpp] view plain copy

void read_cifar_bin(string file_address,vector<Mat>& image,vector<int>& flag)
{
int width = 32, height = 32;//註意這個數值，根據自己樣本的大小進行修改，重要的事情說三遍
ifstream fin(file_address, ios::binary);
while (!fin.eof())
{
char flag_tmp;
unsigned char tmp;
Mat image_tmp(width, height, CV_8UC3);
fin.read((char *)&flag_tmp, sizeof(flag_tmp));
for (int j = 2; j >=0; j--)
{

for (int r = 0; r < image_tmp.rows; r++)
for (int c = 0; c < image_tmp.cols; c++)
{
fin.read((char *)&tmp, sizeof(tmp));
image_tmp.at<Vec3b>(r, c)[j] = tmp;
}
}
image.push_back(image_tmp);
flag.push_back(flag_tmp);
}
}

3，將自己的jpg，png等傳統格式轉化為cifar10支持的bin文件

[cpp] view plain copy

void write_cifar_bin(string file_address, vector<string>& image_address, vector<int>& flag)
{
ofstream fout(file_address, ios::binary);
for (size_t i = 0; i < image_address.size(); i++)
{
Mat image_tmp = imread(image_address[i], 1);
resize(image_tmp, image_tmp, Size(32, 32));
int pix[1024];
char flag_tmp = flag[i];
fout.write((char *)&flag_tmp, sizeof(flag_tmp));
for (int j = 2; j >= 0; j--)
{
for (int r = 0; r < image_tmp.rows; r++)
for (int c = 0; c < image_tmp.cols; c++)
{
unsigned char tmp = image_tmp.at<Vec3b>(r, c)[j];
fout.write((char *)&tmp, sizeof(tmp));
}
}
}
}

4，將bin轉為圖片的測試，並用OpenCV顯示

[cpp] view plain copy

int main()
{
string file_address = "data_batch_1.bin";
vector<Mat> image;
vector<int>flag;
read_cifar_bin(file_address, image, flag);
imshow("test", image[5000]);//隨便需要顯示的圖像。可以跟改[]中數據進行驗證
waitKey();
return 0;
}

5，將bin轉為圖片的測試，並保存為jpg，並且保存相應的flag

[cpp] view plain copy

int main()
{
string file_address = "data_batch_1.bin";
vector<Mat> image;
vector<int>flag;
read_cifar_bin(file_address, image, flag);
ofstream mydata_batch_1("mydata_batch_1.txt");
for (int i = 0; i < image.size(); i++)
{
char buffer[50];
char address[100] = ".\\data_batch_1\\";
_itoa(i, buffer, 10);
imwrite(strcat(address, strcat(buffer, ".jpg")), image[i]);
mydata_batch_1 << address << buffer <<".jpg"<< " " << flag[i] << endl;
cout << i << endl;
waitKey(1);
}
return 0;
}

6，將圖像轉為bin

[cpp] view plain copy

int main()
{
string file_address = "mydata_batch_1.bin";
vector<string> image_address;
vector<int> flag;
ifstream finSample("mydata_batch_1.txt");
char buf[100], buftmp[50], flagtmp[10];
while (!finSample.eof())
{
finSample.getline(buf, sizeof(buf));
sscanf(buf, "%s %s", buftmp, flagtmp);
int tmp=atoi(flagtmp);
image_address.push_back(buftmp);
flag.push_back(tmp);
}
write_cifar_bin(file_address, image_address, flag);
return 0;
}

7，實驗測試

(1)【步驟4】將cifar10的data_batch_1.bin轉化為圖像的測試，從左到右依次為image[0]，image[5000]，image[9999]（cifar10每個batch有10000個圖像，所以是0-9999）

技術分享

(2) 【步驟5】將cifar10的data_batch_1.bin轉化為圖像,並保存在jpg格式的測試。

技術分享

(3)【步驟6】將第二步生成的jpg轉化為bin文件，程序運行後將生成mydata_batch_1.bin，可以看到和原始的data_batch_1.bin有著同樣的大小。

技術分享

那麽到底這個和原始的一樣不一樣呢？我們還是使用步驟4的程序進行測試，同樣的還是測試image[0]，image[5000]，image[9999]，從下圖可以看出和原始的bin的數據是一樣的。

技術分享

有了上面的2個轉化程序，就可以轉化自己的圖像了，then let‘s make some noise!

將自己數據轉化為cifar10支持的lmdb

將自己數據轉化為cifar10支持的lmdb

顯示 c++ track div ifs cat 自己的 align blog 大家都知道，在caffe裏面，要運行cifar10的例子就得先由cifar10的數據庫。由於caffe為了提高運行效率，減少磁盤尋道時間等，統一了數據接口（lmdb，leveldb）。首先，

XML 類型數據轉化為表

tom partition blog abs XML nodes etime art entity BEGIN TRAN DECLARE @XMLDocument XML SET @XMLDocument=‘<Root><Row><A>文

FFmpeg 將YUV數據轉RGB

分配內存 () alloc idt img yuv420 init（）復制 ext void init（） //分配兩個Frame，兩段buff，一個轉換上下文 { 　//為每幀圖像分配內存 m_pFrameYUV = av_frame_alloc();

將dataGridView數據轉成DataTable

循環轉換 tostring tab datatable grid 技術分享 totable ret 如已綁定過數據源： DataTable dt = (dataGridView1.DataSource as DataTable) 如未綁定過數據源：　　　

賦能雲HBase備份恢復百T級別數據量備份恢復支持

操作數展望 process apr nag 傳統機制命令搭建雲HBase發布備份恢復功能，為用戶數據保駕護航。對大多數公司來說數據的安全性以及可靠性是非常重要的，如何保障數據的安全以及數據的可靠是大多數數據庫必須考慮的。2016 IDC的報告表示數據的備份（dat

將SqlDataReader 數據集轉化為datatbale ,在將datatable 轉化為iList

type HERE tostring exception () tar del from helper 1 public IList GetModelList(string tablename, string where) 2 {

【實用代碼片段】將json數據綁定到html元素（轉）

bsp lac website dex spl his can ace htm jQuery擴展 jQuery.fn.extend({ ‘jsonBind‘:function(json){ var dom=this; dom.find(‘[json-b

後臺封裝復雜數據，將數據轉json，傳前臺

utils start 效果 return color gen 復雜 show 技術前臺需要的數據是 function showCurve(dee,daa) { $(‘#container‘).highcharts( { titl

將數組轉化為json字符串（不使用json_encode函數）

enc pan cti 數組轉化為json div UNC key lse public 將數組轉化為json字符串（不使用json_encode函數） 1 public function arrayToJson($arr,$jsonStr=‘‘){ 2

讀取數據庫時將數據轉成XML

lose code 取數據 pen ssr from command col for xml using (SqlConnection conn=new SqlConnection(config)) { conn.Open();

將一，二維數組轉化為Excel格式

das 我們 pandas taf ica type excel格式 list int32 首先，我們來看一下一維數組的，其代碼可以如下： 1 import numpy as np 2 import pandas as pd 3 x = pd.Series([

將數組轉化為List集合

out 字符轉換 nbsp 輸出 mil tro () sts 字符串轉換為數組、將數組轉換為List集合 public void testStringToList(){ String s="123-abc-456"; System.out.println(

BULK語句將TXT數據塞入數據庫表格

tor exec rmi style test name hsi rim mina SET @iSQL=N‘BULK INSERT [TEST].[dbo].[TEST_Interim]‘+‘ FROM ‘+quotename(@fullFileName,‘‘‘‘)+‘

怎樣將本地數據庫放到雲服務器上

server2 類型個數情況本地 rip 文件需要 enter 怎樣將本地數據庫放到雲服務器上？（以sqlserver為例） 1.從本地數據庫導出相應腳本文件。（1）登錄本地數據庫之後，右擊對應的數據，選擇任務---生成腳本，（2）選擇下一步，（3）

FastRCNN 訓練自己數據集 (1編譯配置)

backend key article tail back art model plot osc http://www.cnblogs.com/louyihang-loves-baiyan/p/4885659.html 按照博客的教程配置，但自己在服務器上配置時，USE_C

廣電系統衛星信號ASI數據轉成UDP協議流進入流媒體系統互聯網分發

ASI UDP RTMP 流媒體系統 ASI：傳輸的是數字信號，壓縮視頻信號（例如MPEG2-T，裏面是H.264碼流），用於廣播電視領域。在目前的DVB-C系統設備的傳輸接口有兩種MPEG2視頻碼流傳輸接口標準：異步串行接口ASI和同步並行接口SPI。本文

PHPExcel將Excel數據導入數據庫

保存方法 ksh factory spa tao col 導入 div 1 <?php 2 //PHPExcel讀取導入Excel數據到數據庫(2003,2007通用)使用方法: 3 //先用excel2array（）方法將excel表中的數據存儲到數組，在

如何將CAJ文檔轉化為doc文檔

發送 images alt 如何分享 blog 點擊 png 字體 1.打開CAJ文檔，把你想要復制的字體調整到一頁可以顯示的大小 2.點擊工具欄上面的“文字識別” 3.用鼠標圈住想要顯示復制粘貼的文字 4.就可以隨便了，想要在這個頁面復制粘貼，或者讓發送到word

將GitLab數據庫從阿裏雲PostgreSQL RDS遷移至自建的PostgreSQL服務器

bsp 控制臺創建升級 postgresq pre 低版本 sse esql 阿裏雲RDS目前支持的是PostgreSQL 9.4，而gitlab支持的最低版本是PostgreSQL 9.6.1，不升級PostgreSQL，gitlab就無法升級，阿裏雲RDS短期內不進

C#將LINQ數據集轉換為Datatable

c# linq 轉換 C#將LINQ數據集轉換為Datatable1.方法一：（測試可用）//通過一個公共類將LINQ數據集轉換為datatablepublic DataTable LINQToDataTable<T>(IEnumerable<T> varlist){