caffe多標籤輸入和多工學習

阿新 • • 發佈：2018-12-31

拷貝convert_imageset，生成新工程convert_imageset_multi_label

修改原始碼

std::ifstream infile(argv[2]);
    std::vector<std::pair<std::string, std::vector<float>> > lines;
    std::string filename;
    std::string label_count_string = argv[5];
    int label_count = std::atoi(label_count_string.c_str());
    std::vector 
<float> label(label_count);
    while (infile >> filename) {
        for (int i = 0; i < label_count; i++)
            infile >> label[i];
        lines.push_back(std::make_pair(filename, label));
    }
    if (FLAGS_shuffle) {
        // randomly shuffle data
        LOG(INFO) << " 
Shuffling data";
        shuffle(lines.begin(), lines.end());
    }
    LOG(INFO) << "A total of " << lines.size() << " images.";

    if (encode_type.size() && !encoded)
        LOG(INFO) << "encode_type specified, assuming encoded=true.";

    int resize_height = std::max<int 
>(0, FLAGS_resize_height);
    int resize_width = std::max<int>(0, FLAGS_resize_width);

    // Create new DB
    scoped_ptr<db::DB> db_image(db::GetDB(FLAGS_backend));
    scoped_ptr<db::DB> db_label(db::GetDB(FLAGS_backend));
    db_image->Open(argv[3], db::NEW);
    db_label->Open(argv[4], db::NEW);
    scoped_ptr<db::Transaction> txn_image(db_image->NewTransaction());
    scoped_ptr<db::Transaction> txn_label(db_label->NewTransaction());

//   // Create new DB
//   scoped_ptr<db::DB> db(db::GetDB(FLAGS_backend));
//   db->Open(argv[3], db::NEW);
//   scoped_ptr<db::Transaction> txn(db->NewTransaction());

  // Storing to db
  std::string root_folder(argv[1]);
  Datum datum_image;
  Datum datum_label;
  int count = 0;
  int data_size = 0;
  bool data_size_initialized = false;

  for (int line_id = 0; line_id < lines.size(); ++line_id) {
    bool status;
    std::string enc = encode_type;
    if (encoded && !enc.size()) {
      // Guess the encoding type from the file name
      string fn = lines[line_id].first;
      size_t p = fn.rfind('.');
      if ( p == fn.npos )
        LOG(WARNING) << "Failed to guess the encoding of '" << fn << "'";
      enc = fn.substr(p);
      std::transform(enc.begin(), enc.end(), enc.begin(), ::tolower);
    }
    status = ReadImageToDatum(root_folder + lines[line_id].first,
        lines[line_id].second[0], resize_height, resize_width, is_color,
        enc, &datum_image);
    if (status == false) continue;
    if (check_size) {
      if (!data_size_initialized) {
          data_size = datum_image.channels() * datum_image.height() * datum_image.width();
        data_size_initialized = true;
      } else {
          const std::string& data = datum_image.data();
        CHECK_EQ(data.size(), data_size) << "Incorrect data field size "
            << data.size();
      }
    }
    // sequential
    string key_str = caffe::format_int(line_id, 8) + "_" + lines[line_id].first;

    // Put in db
    string out;
    CHECK(datum_image.SerializeToString(&out));
    txn_image->Put(key_str, out);
    //////////////////////////////////////////////////////////////////////////    
    
    datum_label.set_channels(label_count);
    datum_label.set_height(1);
    datum_label.set_width(1);
    
    datum_label.clear_data();
    datum_label.clear_float_data();
    datum_label.set_encoded(false);
    std::vector<float> label_vec = lines[line_id].second;
    for (int i = 0; i < label_vec.size();i++)
    {
        datum_label.add_float_data(label_vec[i]);
    }
string out_label;
    CHECK(datum_label.SerializeToString(&out_label));
    txn_label->Put(key_str, out_label);
    //////////////////////////////////////////////////////////////////////////
if (++count % 1000 == 0) {
      // Commit db
      txn_image->Commit();
      txn_image.reset(db_image->NewTransaction());

      txn_label->Commit();
      txn_label.reset(db_label->NewTransaction());

      LOG(INFO) << "Processed " << count << " files.";
    }
  }
  // write the last batch
  if (count % 1000 != 0) {
    txn_image->Commit();
    txn_label->Commit();
    LOG(INFO) << "Processed " << count << " files.";
  }

上述方式使用了二個data層，編譯之後，使用如下方式生成：

Build\x64\Release>convert_imageset_multi_label.exe ./ train.txt data/train_image_lmdb data/train_label_lmdb 4

train.txt檔案格式如下：

data/00A03AF5-41C7-4966-8EF3-8B2C90DCF75C_cgfn.jpg 1 2 3 6
data/00A15FBD-9637-44C5-B2E7-81611263C88C_tmph.jpg 2 5 6 4

網路配置檔案需要加入slice層將標籤分割開來

layer {
name: "slice"
type: "Slice"
bottom: "label"
top: "label_1"
top: "label_2"
top: "label_3"
top: "label_4"
slice_param {
    axis: 1
    slice_point: 1
    slice_point: 2
    slice_point: 3
}
}

也可以通過python直接生成lmdb格式，其方式如下：

# -*- coding: utf-8 -*-
"""
Created on Sat Dec 24 20:57:28 2016

@author: zhouly
"""

import lmdb
from skimage import io
import numpy as np 
import sys
caffe_root = '../../'
sys.path.insert(0, caffe_root + '/python')
import caffe
import cv2
root = '../../'
file_input=open(root+'data/train.txt','r')
in_image_db=lmdb.open(root+'examples/99/train_image_lmdb', map_size=int(1e12))
in_label_db=lmdb.open(root+'examples/99/train_label_lmdb', map_size=int(1e12))
in_image_txn = in_image_db.begin(write=True)
in_label_txn = in_label_db.begin(write=True)
for in_idx, in_ in enumerate(file_input):
    content = in_.strip()
    content = content.split(' ')
    im_file = root + 'data/verification/' + content[0]
    try:
        im = io.imread(im_file)
    except:
        print '-------------------------', im_file
        continue
    im = im[:,:, 3]
    im = cv2.resize(im, (224, 224), interpolation=cv2.INTER_LINEAR)
    data = np.zeros((3, 224, 224), np.uint8)
    data[0, :, :] = im[:, :]
    data[1, :, :] = im[:, :]
    data[2, :, :] = im[:, :]
    im_dat = caffe.io.array_to_datum(data)
    in_image_txn.put('{:0>10d}'.format(in_idx), im_dat.SerializeToString())
    print 'data train: {} [{}]'.format(content[0], in_idx + 1)
    del im_file, im, im_dat, data

    target_label = np.zeros((4, 1, 1))
    target_label[0, 0, 0] = int(content[1])
    target_label[1, 0, 0] = int(content[2])
    target_label[2, 0, 0] = int(content[3])
    target_label[3, 0, 0] = int(content[4])
    label_data = caffe.io.array_to_datum(target_label)
    in_label_txn.put('{:0>10d}'.format(in_idx), label_data.SerializeToString())
    del target_label, label_data
in_image_txn.commit()
in_label_txn.commit()
in_image_db.close()
in_label_db.close()
file_input.close()

caffe多標籤輸入和多工學習

拷貝convert_imageset，生成新工程convert_imageset_multi_label 修改原始碼 std::ifstream infile(argv[2]); std::vector<std::pair<std::string, std::vector<flo

Python學習記錄-多進程和多線程

python 線程進程 Python學習記錄-多進程和多線程 [TOC] 1. 進程和線程進程狹義定義：進程是正在運行的程序的實例（an instance of a computer program that is being executed）。廣義定義：進程是一個具有一定獨立功能的程序關

div或者p標籤單行和多行超出顯示省略號

單行文字溢位顯示省略號 overflow: hidden; text-overflow:ellipsis; white-space: nowrap; 多行文字顯示省略號 display: -webkit-box; -webkit-box-orient:&nb

linux 用指令碼開啟多個terminal和多個標籤頁

每次開電腦一個個開啟多個terminal和多個標籤頁很麻煩，搜了一下相關資料，寫了一個自己實用的。每次執行此指令碼即可。１。舉例： gnome-terminal -t "cuizx 2017-09" -x bash -c "cd /home/work;exec bash

學習筆記之linux多執行緒和多程序優缺點

Linux下的多執行緒執行緒和程序相比的缺點和優點優點：多執行緒對資源的需求少，建立的代價比程序小缺點：除錯困難，非常容易出錯執行緒擁有獨立的程式計數器，獨立的棧空間，共享程序的全域性記憶體和堆記憶體，共享檔案描述符，共享虛擬記憶體。繼承訊號的處理可以訪問程序

Python多線程和多進程誰更快？

-s roc finally scan lis fun import 行鎖 sys python多進程和多線程誰更快 python3.6 threading和multiprocessing 四核+三星250G-850-SSD 自從用多進程和多線程進行編程,一致沒搞懂到

多線程和多進程的選擇

linux多進程多線程第一次寫博客。。。最近發現很多技術的東西看了很快又忘了，希望通過自己的理解寫出來，我想這是一種方法吧。前段時間去面試linux軟件，面試官問我多線程和多進程有什麽優缺點，什麽時候使用多進程，多線程，當時就懵逼。其實之前有在網上看到過這個問題和答案，然後略看了一眼，沒有真正去了解。如果現

多線程和多進程之間的區別

true 需求改善建立 static變量需要 CP 創建應用程序 1）需要頻繁創建銷毀的優先用線程這種原則最常見的應用就是Web服務器了，來一個連接建立一個線程，斷了就銷毀線程，要是用進程，創建和銷毀的代價是很難承受的 2）需要進行大量計算的優先使用線程

python多進程和多線程

done 創建組成需要 getpid ret nat set write 多任務才有多進程和線程：線程是最小的執行單元，而進程由至少一個線程組成。如何調度進程和線程，完全由操作系統決定，程序自己不能決定什麽時候執行，執行多長時間。多進程和多線程的程序涉及到同步、數據

python socket多線程和多進程

socket多線程 socket多進程並發socket 在socket中，如果直接創建的話，是只能接受一個用戶的請求需要實現socketserver中的handle方法，可以實現多進程並發訪問 SocketServer內部使用 IO多路復用以及 “多線程” 和 “多進程” ，從而實現並發處理

hibernate關於多對多映射和多對一的hql查詢

nfa nat alt sso true chan select csdn exc public void queryCustomerbymerchantId(){ SessionFactory sf = HibernateUtil.getSessio

Android程序員必須掌握的知識點-多進程和多線程

線程安全適用於傳遞觸摸播放音樂 RF tro ins 如果當某個應用組件啟動且該應用沒有運行其他任何組件時，Android 系統會使用單個執行線程為應用啟動新的 Linux 進程。默認情況下，同一應用的所有組件在相同的進程和線程（稱為“主”線程）中運行。如果某個

搞定python多線程和多進程

觸發不一定並不會守護線程執行 comm mes 權限 pipe 1.1 線程 1.1.1 什麽是線程線程是操作系統能夠進行運算調度的最小單位。它被包含在進程之中，是進程中的實際運作單位。一條線程指的是進程中一個單一順序的控制流，一個進程中可以並發多個線程，每條線程

python多線程和多進程（一）

5.0 16px time img 繼承 total 線程鎖 nco 第一次一、多線程 Python的標準庫提供了兩個模塊：_thread和threading，_thread是低級模塊，threading是高級模塊，對_thread進行了封裝。絕大多數情況下，只需要使用

python多線程和多進程（二）

模型 pre 否則 sel main 競爭並發執行 turn 定制 ---恢復內容開始--- 一、多進程　　1、multiprocessing模塊用來開啟子進程，並在子進程中執行我們定制的任務（比如函數），該模塊與多線程模塊threading的編程接口類似。 impo

firedac引擎DATASNAP多表查詢和多表提交

datasnap des copy for dac proc fired close ats firedac引擎DATASNAP多表查詢和多表提交屬性設置FDTableAdapter1.SchemaAdapter := FDSchemaAdapter;FDTableAda

python多線程和多進程

.exe mysq date ide () mta tar 進程池 ase Python多線程存取MySQL數據為什麽在Python裏推薦使用多進程而不是多線程？廖雪峰關於多進程 python進程池剖析（二）示例說話準備數據庫，數據表 # 新建數據庫 create

mysql 多行(GROUP_CONCAT)和多列(CONCAT)的合並函數

group by select style sep png 分隔符 key () tor 1，多行合並：把查詢的一行或者多行進行合並。 SELECT GROUP_CONCAT(md.data1) FROM DATA md,contacts cc WHERE md.cons

Json序列化，有多對一和多對多關系時出現的問題

oca lan util 一對一屬性。 sans 雙向 rate stat /** * 這是一張單表中的雙向一對多，多對一關系。自己跟自己一對多多對一 */ @Entity @Table(name="tb_test") public class

Json序列化，有多對一和多對多關係時出現的問題

/** * 這是一張單表中的雙向一對多，多對一關係。自己跟自己一對多多對一 */ @Entity @Table(name="tb_test") public class CreditsEventBean implements Serializable{ private s

caffe多標籤輸入和多工學習

相關推薦