mxnet深度學習實戰：跑自己的資料實驗和一些問題總結

阿新 • • 發佈：2018-12-22

用mxnet跑自己的資料

0 程式碼編譯

git clone https://github.com/dmlc/mxnet.git

git clone https://github.com/dmlc/mshadow.git

git clone https://github.com/dmlc/dmlc-core.git

git clone https://github.com/dmlc/ps-lite.git

make -j4

1 資料準備

參考 http://blog.csdn.net/a350203223/article/details/50263737 把資料轉換成 REC 模式。

備註： make_list.py 可以自動生成 train 和 val 的 lst檔案。可使用引數 --train_ratio=XXX

2 跑資料

參考mxnet/example/image-classification裡面train_cifar10.py 和 symbol_inception-bn-28-small.py

symbol檔案主要用來儲存網路結構

一個簡單的3層CNN網路

symbol_UCM.py

import find_mxnet
import mxnet as mx
def get_symbol(num_classes = 21):
data = mx.symbol.Variable('data')
# first conv
conv1 = mx.symbol.Convolution(data=data, kernel=(3

,3), num_filter=128)
bn1 = mx.symbol.BatchNorm(data=conv1)
relu1 = mx.symbol.Activation(data=bn1, act_type="relu")
pool1 = mx.symbol.Pooling(data=relu1, pool_type="max",
kernel=(5,5), stride=(3,3))
# second conv
conv2 = mx.symbol.Convolution(data=pool1, kernel=(3

,3), num_filter=196)
bn2 = mx.symbol.BatchNorm(data=conv2)
relu2 = mx.symbol.Activation(data=bn2, act_type="relu")
pool2 = mx.symbol.Pooling(data=relu2, pool_type="max",
kernel=(3,3), stride=(2,2))
# second conv
conv3 = mx.symbol.Convolution(data=pool2, kernel=(3,3), num_filter=196)
bn3 = mx.symbol.BatchNorm(data=conv3)
relu3 = mx.symbol.Activation(data=bn3, act_type="relu")
pool3 = mx.symbol.Pooling(data=relu3, pool_type="max",
kernel=(2,2), stride=(2,2), name="final_pool")
# first fullc
flatten = mx.symbol.Flatten(data=pool3)
fc1 = mx.symbol.FullyConnected(data=flatten, num_hidden=420)
relu4 = mx.symbol.Activation(data=fc1, act_type="relu")
# second fullc
fc2 = mx.symbol.FullyConnected(data=relu4, num_hidden=num_classes)
# loss
softmax = mx.symbol.SoftmaxOutput(data=fc2, name='softmax')
return softmax

train_UCM.py

import find_mxnet
import mxnet as mx
import argparse
import os, sys
import train_model
parser = argparse.ArgumentParser(description='train an image classifer on UCMnet')
parser.add_argument('--network', type=str, default='UCM_128_BN3layer',
help = 'the cnn to use')
parser.add_argument('--data-dir', type=str, default='/home/panda/Ureserch/data/Scene/UCM/',
help='the input data directory')
parser.add_argument('--gpus', type=str, default='0',
help='the gpus will be used, e.g "0,1,2,3"')
parser.add_argument('--num-examples', type=int, default=1680,
help='the number of training examples')
parser.add_argument('--batch-size', type=int, default=64,
help='the batch size')
parser.add_argument('--lr', type=float, default=.01,
help='the initial learning rate')
parser.add_argument('--lr-factor', type=float, default=.94,
help='times the lr with a factor for every lr-factor-epoch epoch')
parser.add_argument('--lr-factor-epoch', type=float, default=5,
help='the number of epoch to factor the lr, could be .5')
parser.add_argument('--model-prefix', type=str,
help='the prefix of the model to load/save')
parser.add_argument('--num-epochs', type=int, default=80,
help='the number of training epochs')
parser.add_argument('--load-epoch', type=int,
help="load the model on an epoch using the model-prefix")
parser.add_argument('--kv-store', type=str, default='local',
help='the kvstore type')
# 存放訓練資訊，用來畫 training curve
parser.add_argument('--log-file', type=str,default="xxx",
help='the name of log file')
parser.add_argument('--log-dir', type=str, default="/xxx/xxx/xxx/",
help='directory of the log file')
args = parser.parse_args()
# network
import importlib
net = importlib.import_module('symbol_' + args.network).get_symbol(21)
# data 如果沒有 image-mean ，會自動計算，存放於 args.data_dir + "xxx.bin"
def get_iterator(args, kv):
data_shape = (3, 109, 109)
train = mx.io.ImageRecordIter(
path_imgrec = args.data_dir + "xxx.rec",
mean_img = args.data_dir + "xxx.bin",
data_shape = data_shape,
batch_size = args.batch_size,
rand_crop = True,
rand_mirror = True,
num_parts = kv.num_workers,
part_index = kv.rank)
val = mx.io.ImageRecordIter(
path_imgrec = args.data_dir + "xxxrec",
mean_img = args.data_dir + "xxx.bin",
rand_crop = False,
rand_mirror = False,
data_shape = data_shape,
batch_size = args.batch_size,
num_parts = kv.num_workers,
part_index = kv.rank)
return (train, val)
# train
train_model.fit(args, net, get_iterator)

3. 利用 log 畫 training和val曲線

需用到matplotlib，提前安裝

import matplotlib.pyplot as plt
import numpy as np
import re
import argparse
parser = argparse.ArgumentParser(description='Parses log file and generates train/val curves')
parser.add_argument('--log-file', type=str,default="/home/panda/Ureserch/mxnet_panda/UCM_EXP/UCM_128_log_4",
help='the path of log file')
args = parser.parse_args()
TR_RE = re.compile('.*?]\sTrain-accuracy=([\d\.]+)')
VA_RE = re.compile('.*?]\sValidation-accuracy=([\d\.]+)')
log = open(args.log_file).read()
log_tr = [float(x) for x in TR_RE.findall(log)]
log_va = [float(x) for x in VA_RE.findall(log)]
idx = np.arange(len(log_tr))
plt.figure(figsize=(8, 6))
plt.xlabel("Epoch")
plt.ylabel("Accuracy")
plt.plot(idx, log_tr, 'o', linestyle='-', color="r",
label="Train accuracy")
plt.plot(idx, log_va, 'o', linestyle='-', color="b",
label="Validation accuracy")
plt.legend(loc="best")
plt.xticks(np.arange(min(idx), max(idx)+1, 5))
plt.yticks(np.arange(0, 1, 0.2))
plt.ylim([0,1])
plt.show()

4. 儲存訓練好的模型

在 train_model.py 加入如下程式碼，訓練完成後儲存

prefix = 'UCM_MODEL'
iteration = args.num_epochs
model.save(prefix, iteration)

5. 利用儲存的模型進行predict

predict_UCM.py

import find_mxnet
import mxnet as mx
import logging
import argparse
import os, sys
import train_model
import numpy as np
# 這裡用的 mxnet 的 imanet訓練的 Inception模型，其他模型同理
prefix = '/home/panda/Ureserch/mxnet_panda/inception-21k model/Inception'
iteration = 9
model_load = mx.model.FeedForward.load(prefix, iteration)
data_shape = (3, 224, 224)
# 資料準備 batch_size = 1.
val = mx.io.ImageRecordIter(
path_imgrec = '/xxx/xxx/' + "xxx.rec",
mean_img = '/xxx/xxx/' + "xxx.bin",
rand_crop = False,
rand_mirror = False,
data_shape = data_shape,
batch_size = 1)
[prob, data1, label1] = model_load.predict(val, return_data=True)

6 利用 pretrain模型提取任意層特徵

feature_extraction.py

模型和資料準備如 step.5，還是

internals = model_load.symbol.get_internals()
# 記住要提取特徵的那一層的名字。我這是 flatten 。
fea_symbol = internals["flatten_output"]
feature_extractor = mx.model.FeedForward(ctx=mx.gpu(), symbol=fea_symbol, numpy_batch_size=1,
arg_params=model_load.arg_params, aux_params=model_load.aux_params,
allow_extra_params=True)
[val_feature, valdata, vallabel]= feature_extractor.predict(val, return_data=True)
利用 scipy 儲存為 matlab格式。畢竟matlab簡單好操
import scipy.io as sio
sio.savemat('/xxx/xxx.mat', {'val_feature':val_feature})

7 利用 pretrain 模型來初始化你的網路引數。
再續

mxnet深度學習實戰：跑自己的資料實驗和一些問題總結

用mxnet跑自己的資料 0 程式碼編譯 git clone https://github.com/dmlc/mxnet.git git clone https://github.com/dmlc/mshadow.git git clone https://gi

深度學習（tensorflow） —— 自己資料集讀取opencv

先來看一下我們的目錄： dataset1 和creat_dataset.py 屬於同一目錄 mergeImg1 和mergeImg2 為Dataset1的兩子目錄（兩類為例子）目錄中儲存影象等檔案核心檔案creat_dataset.py 檔案如下#來生成訓練集和測試集的矩陣 im

深度學習對話系統理論篇--資料集和評價指標介紹

對話系統常用評價指標當前對話系統之所以還沒有取得突破性的進展，很大程度上是因為沒有一個可以準確表示回答效果好壞的評價標準。對話系統中大都使用機器翻譯、摘要生成領域提出來的評價指標，但是很明顯對話系統的場景和需求與他們是存在差別的，這也是當前模型效果不是很好的

TensorFlow深度學習實戰（一）：AlexNet對MNIST資料集進行分類

概要進來一段時間在看深度學習中經典的CNN模型相關論文。同時，為了督促自己學習TensorFlow，通讀論文之後開始，利用TensorFlow實現各個模型，復現相關實驗。這是第一篇論文講解的是AlexNet，論文下載網址為：ImageNet Classific

深度學習分割：（1）資料彙總

時間關係，備份一些深度學習分割演算法相關的部落格和介紹文章。分割演算法綜述介紹了幾個比較經典且非常重要的深度學習分割演算法。原作地址：https://blog.csdn.net/weixin_41923961/article/details/80946586 更加全面的一篇

機器學習實戰——預測數值型資料：迴歸實現記錄

關於利用資料集繪圖建立模型 >>> import regression >>> xArr, yArr= regression.loadDataSet('ex0.txt') >>> ws= regression.standRegres(xAr

分享《Keras快速上手：基於Python的深度學習實戰》+PDF+謝樑

下載：https://pan.baidu.com/s/1AssHJf6RTWF2EjUlV6hTyw 更多資料分享：http://blog.51cto.com/14087171 《Keras快速上手：基於Python的深度學習實戰》高清PDF，531頁，帶書籤目錄，文字可以複製。這是一本少見的深入淺出

分享《Keras快速上手：基於Python的深度學習實戰》+PDF+謝梁

深度學習 oss 抽象 image 高清 ddc 參考 ESS img 下載：https://pan.baidu.com/s/1AssHJf6RTWF2EjUlV6hTyw 更多資料分享：http://blog.51cto.com/14087171 《Keras快速上手：基

分享《Keras快速上手：基於Python的深度學習實戰(謝樑等)》PDF版+原始碼+mobi版

下載：https://pan.baidu.com/s/1u0gYCTbT1I2rq88AFDV3Mg 更多資料：http://blog.51cto.com/14050756 PDF版，531頁，帶書籤目錄，彩色配圖，文字可以複製貼上。配套原始碼和資料。系統地講解了深度學習的基本知識、建模過程和應用，並

分享《Keras快速上手：基於Python的深度學習實戰(謝梁等)》PDF版+源代碼+mobi版

href img 復制粘貼推薦 term python 技術 roc 自然下載：https://pan.baidu.com/s/1u0gYCTbT1I2rq88AFDV3Mg 更多資料：http://blog.51cto.com/14050756 PDF版，531頁，帶

《Keras快速上手：基於Python的深度學習實戰(謝樑等)》PDF版+原始碼+mobi版

下載： https://pan.baidu.com/s/1u0gYCTbT1I2rq88AFDV3Mg 更多分享資料： https://pan.baidu.com/s/1g4hv05UZ_w92uh9NNNkCaA PDF版，531頁，帶書籤目錄，彩色配圖，文字可

實戰 Google 深度學習框架：TensorFlow 計算加速

# -*- coding: utf-8 -*- from datetime import datetime import os import time import tensorflow as tf import mnist_inference # 定義訓練神經網路時需要用到的配置。這些配置與5.5節中

深度學習實戰（1）--手機跑目標檢測模型（YOLO，從DarkNet到Caffe再到NCNN完整打通）

這篇算是關鍵技術貼，YOLO是什麼、DarkNet是什麼、Caffe是什麼、NCNN又是什麼…等等這一系列科普這裡就完全不說了，牽扯實在太多，通過其他帖子有一定的積累後，看這篇就相對容易了。本文核心：把一個目標檢測模型跑到手機上整個工作分以下幾個階段： 1

分享《Keras快速上手：基於Python的深度學習實戰-謝樑》高清版PDF免費下載

2018-11-29 15:27:13 百度網盤下載：https://pan.baidu.com/s/1FsmtI2JqzsWPPc9Ev8iXww 《Keras快速上手：基於Python的深度學習實戰》高清PDF，531頁，帶書籤目錄，文字可以複製。這是一本少見的深入淺出介紹深度學習的入門書籍。

深度學習實戰（1）--手機端跑YOLO目標檢測網路（從DarkNet到Caffe再到NCNN完整打通）

深度學習實戰（1）--手機端跑YOLO目標檢測網路（從DarkNet到Caffe再到NCNN完整打通）這篇算是關鍵技術貼，YOLO是什麼、DarkNet是什麼、Caffe是什麼、NCNN又是什麼…等等這一系列科普這裡就完全不說了，牽扯實在太多，通過其他帖子有一定的積累後，看這

深度學習實戰教程（1）--手機上跑目標檢測模型（YOLO，從DarkNet到Caffe再到NCNN完整打通）

https://github.com/lwplw 這篇打算就直入主題了，YOLO是什麼、DarkNet是什麼、Caffe是什麼、NCNN又是什麼…等等這一系列的基礎科普這裡就完全不說了，牽扯實在太多，通過其他帖子有一定的積累後，看這篇就相對容易了。本文核心：把一個目標檢測模型跑

深度學習實戰（3）-打造自己的影象識別模型

這個筆記弄的我難受，推薦觀看者還是看原書吧............ 用VGG16作為例子簡單介紹：如何使用，去掉尾部，保留引數初始值如何訓練資料準備檔案轉換 data_convert.py原始碼： # coding:utf-8 fr

深度學習實戰——caffe windows 下訓練自己的網路模型

1、相關準備 1.1 手寫數字資料集 1.2深度學習框架本實戰基於caffe深度學習框架，需自行參考相關部落格搭建環境，這裡不再對如何搭建環境作介紹。 2、資料準備 2.

深度學習caffe平臺--製作自己.lmdb格式資料集及分類標籤檔案

caffe對於訓練資料格式，支援：lmdb、h5py……，其中lmdb資料格式常用於單標籤資料，像分類等，經常使用lmdb的資料格式。對於迴歸等問題，或者多標籤資料，一般使用h5py資料的格式。當然好像還有其它格式的資料可用，本文就主要針對lmdb資料格式的製作方法，進行簡

深度學習利器：TensorFlow使用實戰分享

深度學習及TensorFlow簡介深度學習目前已經被應用到影象識別，語音識別，自然語言處理，機器翻譯等場景並取得了很好的行業應用效果。至今已有數種深度學習框架，如TensorFlow，Caffe、Theano、Torch、MXNet，能夠支援深度神經網路、卷

mxnet深度學習實戰：跑自己的資料實驗和一些問題總結

相關推薦