MatConvNet卷積神經網路（四）——用自己的資料訓練

阿新 • • 發佈：2019-02-16

嘗試過從Matconvnet官網上下載的已經訓練好的神經網路之後，最近自己訓練了能夠識別果樹上紅蘋果的神經網路。先上圖。原始碼放在https://github.com/YunpengZhai/MATCONVNET

10/21/2016 更新：把滑動窗的程式碼放到了github上（結尾為**slide）

下面分享一下經驗。

以下內容看之前，希望已經閱讀過Matconvnet的官方文件matconvnet-manual，或者對機器學習的一些概念、卷積神經網路的原理具備基本的瞭解。

現在進入正題。

構建自己的神經網路，需要完成以下三個部分：

1.準備資料。

2.設計神經網路的結構。

3.設定引數，用資料訓練網路。

一、準備資料。

資料在磁碟中的存放如下圖：

之後，將檔案中的圖片匯入、格式化、劃分訓練集測試集交叉驗證集、求均值，然後以.mat格式儲存在磁碟上。

%cnn_setup_data.m

<span style="font-size:14px;">function imdb =cnn_setup_data(datadir)

inputSize =[64,64];
subdir=dir(datadir);
imdb.images.data=[];
imdb.images.labels=[];
imdb.images.set = [] ;
imdb.meta.sets = {'train', 'val', 'test'} ;
image_counter=0;
trainratio=0.8;
for i=3:length(subdir)
    imdb.meta.classes(i-2) = {subdir(i).name};
    imgfiles=dir(fullfile(datadir,subdir(i).name));
    imgpercategory_count=length(imgfiles)-2;
    disp([i-2 imgpercategory_count]);
    image_counter=image_counter+imgpercategory_count;
    for j=3:length(imgfiles)
        img=imread(fullfile(datadir,subdir(i).name,imgfiles(j).name));
        img=imresize(img, inputSize(1:2));
        img=single(img);
        imdb.images.data(:,:,:,end+1)=single(img);
        imdb.images.labels(end+1)= i-2;
        if j-2<imgpercategory_count*trainratio
            imdb.images.set(end+1)=1;
        else
            imdb.images.set(end+1)=3;
        end
    end
end

dataMean=mean(imdb.images.data,4);
imdb.images.data = single(bsxfun(@minus,imdb.images.data, dataMean)) ;
imdb.images.data_mean = single(dataMean);%!!!!!!!!!!!
end</span>

二、初始化神經網路

這一部分包括了對神經網路各個層的設計（比如每一層的種類、維度、正則化，以及在訓練中的一些引數等）。

%cnn_mnist_init.m

<span style="font-size:14px;">function net = cnn_mnist_init(varargin)
% CNN_MNIST_LENET Initialize a CNN similar for MNIST
opts.batchNormalization = true ;
opts.networkType = 'simplenn' ;
opts = vl_argparse(opts, varargin) ;

rng('default');
rng(0) ;

f=1/100 ;
net.layers = {} ;
net.layers{end+1} = struct('type', 'conv', ...
                           'weights', {{f*randn(5,5,3,20, 'single'), zeros(1, 20, 'single')}}, ...
                           'stride', 1, ...
                           'pad', 0) ;
net.layers{end+1} = struct('type', 'pool', ...
                           'method', 'max', ...
                           'pool', [2 2], ...
                           'stride', 2, ...
                           'pad', 0) ;
net.layers{end+1} = struct('type', 'conv', ...
                           'weights', {{f*randn(10,10,20,50, 'single'),zeros(1,50,'single')}}, ...
                           'stride', 1, ...
                           'pad', 0) ;
net.layers{end+1} = struct('type', 'pool', ...
                           'method', 'max', ...
                           'pool', [2 2], ...
                           'stride', 2, ...
                           'pad', 0) ;
net.layers{end+1} = struct('type', 'conv', ...
                           'weights', {{f*randn(10,10,50,500, 'single'),  zeros(1,500,'single')}}, ...
                           'stride', 1, ...
                           'pad', 0) ;
net.layers{end+1} = struct('type', 'relu') ;
net.layers{end+1} = struct('type', 'conv', ...
                           'weights', {{f*randn(1,1,500,4, 'single'), zeros(1,4,'single')}}, ...
                           'stride', 1, ...
                           'pad', 0) ;
net.layers{end+1} = struct('type', 'softmaxloss') ;

% optionally switch to batch normalization
if opts.batchNormalization
  net = insertBnorm(net, 1) ;
  net = insertBnorm(net, 4) ;
  net = insertBnorm(net, 7) ;
end

% Meta parameters
net.meta.inputSize = [64 64] ;
net.meta.trainOpts.learningRate = 0.0005 ;
net.meta.trainOpts.numEpochs = 30 ;
net.meta.trainOpts.batchSize = 200 ;

% Fill in defaul values
net = vl_simplenn_tidy(net) ;

% Switch to DagNN if requested
switch lower(opts.networkType)
  case 'simplenn'
    % done
  case 'dagnn'
    net = dagnn.DagNN.fromSimpleNN(net, 'canonicalNames', true) ;
    net.addLayer('top1err', dagnn.Loss('loss', 'classerror'), ...
      {'prediction', 'label'}, 'error') ;
    net.addLayer('top5err', dagnn.Loss('loss', 'topkerror', ...
      'opts', {'topk', 5}), {'prediction', 'label'}, 'top5err') ;
  otherwise
    assert(false) ;
end

% --------------------------------------------------------------------
function net = insertBnorm(net, l)
% --------------------------------------------------------------------
assert(isfield(net.layers{l}, 'weights'));
ndim = size(net.layers{l}.weights{1}, 4);
layer = struct('type', 'bnorm', ...
               'weights', {{ones(ndim, 1, 'single'), zeros(ndim, 1, 'single')}}, ...
               'learningRate', [1 1 0.05], ...
               'weightDecay', [0 0]) ;
net.layers{l}.biases = [] ;
net.layers = horzcat(net.layers(1:l), layer, net.layers(l+1:end)) ;</span><span style="font-size:18px;">
</span>

該網路結構：

三、訓練網路

%cnn_mnist.m

<span style="font-size:14px;">function [net, info] = cnn_mnist(varargin)
%CNN_MNIST  Demonstrates MatConvNet on MNIST

run(fullfile(fileparts(mfilename('fullpath')),...
  '..', '..', 'matlab', 'vl_setupnn.m')) ;

opts.batchNormalization = false ;
opts.networkType = 'simplenn' ;
[opts, varargin] = vl_argparse(opts, varargin) ;

sfx = opts.networkType ;
if opts.batchNormalization, sfx = [sfx '-bnorm'] ; end
datadir='E:\學習\機器學習\matconvnet-1.0-beta20\photos\multi-label';
opts.expDir = fullfile(vl_rootnn, 'data', ['mnist-zyp-' sfx]) ;
[opts, varargin] = vl_argparse(opts, varargin) ;

opts.dataDir = fullfile(vl_rootnn, 'data', 'mnist') ;
opts.imdbPath = fullfile(opts.expDir, 'imdb.mat');
opts.train = struct() ;
opts = vl_argparse(opts, varargin) ;
if ~isfield(opts.train, 'gpus'), opts.train.gpus = []; end;

% --------------------------------------------------------------------
%                                                         Prepare data
% --------------------------------------------------------------------

net = cnn_mnist_init('batchNormalization', opts.batchNormalization, ...
                     'networkType', opts.networkType) ;

if exist(opts.imdbPath, 'file')
  imdb = load(opts.imdbPath) ;
else
  imdb=cnn_setup_data(datadir);
  mkdir(opts.expDir) ;
  save(opts.imdbPath, '-struct', 'imdb') ;
end

net.meta.classes.name = arrayfun(@(x)sprintf('%d',x),1:2,'UniformOutput',false) ;

% --------------------------------------------------------------------
%                                                                Train
% --------------------------------------------------------------------

switch opts.networkType
  case 'simplenn', trainfn = @cnn_train ;
  case 'dagnn', trainfn = @cnn_train_dag ;
end

[net, info] = trainfn(net, imdb, getBatch(opts), ...
  'expDir', opts.expDir, ...
  net.meta.trainOpts, ...
  opts.train, ...
  'val', find(imdb.images.set == 3)) ;
net.meta.data_mean = imdb.images.data_mean;
net.layers{end}.class = [1] ;

% --------------------------------------------------------------------
function fn = getBatch(opts)
% --------------------------------------------------------------------
switch lower(opts.networkType)
  case 'simplenn'
    fn = @(x,y) getSimpleNNBatch(x,y) ;
  case 'dagnn'
    bopts = struct('numGpus', numel(opts.train.gpus)) ;
    fn = @(x,y) getDagNNBatch(bopts,x,y) ;
end

% --------------------------------------------------------------------
function [images, labels] = getSimpleNNBatch(imdb, batch)
% --------------------------------------------------------------------
images = imdb.images.data(:,:,:,batch) ;
labels = imdb.images.labels(1,batch) ;

% --------------------------------------------------------------------
function inputs = getDagNNBatch(opts, imdb, batch)
% --------------------------------------------------------------------
images = imdb.images.data(:,:,:,batch) ;
labels = imdb.images.labels(1,batch) ;
if opts.numGpus > 0
  images = gpuArray(images) ;
end
inputs = {'input', images, 'label', labels} ;</span><span style="font-size:18px;">
</span>

四、應用——測試程式

<span style="font-size:14px;">%初次執行一次，之後不再執行
%[net_bn, info_bn] = cnn_mnist('batchNormalization', true);
load('E:\學習\機器學習\matconvnet-1.0-beta20\data\mnist-zyp-simplenn-bnorm\imdb.mat');
im=imread('E:\學習\機器學習\matconvnet-1.0-beta20\photos\QQ截圖20160922172145.png');
im=imresize(im,[64 64 ]);
imshow(im);
im = single(im);
im = im - images.data_mean;
res = vl_simplenn(net_bn, im,[],[],...
                      'accumulate', 0, ...
                      'mode', 'test', ...
                      'backPropDepth', inf, ...
                      'sync', 0, ...
                      'cudnn', 1) ;
scores = res(11).x(1,1,:);
[bestScore, best] = max(scores);
switch best
    case 1
        title('判斷結果：不是蘋果');
    case 2
        title('判斷結果：1個蘋果');
    case 3
        title('判斷結果：2個蘋果');
    case 4 
        title('判斷結果：3個蘋果');
end</span><span style="font-size:18px;">
</span>

測試一下：

PS：寫著寫著就懶得寫註釋了。

配合滑動窗的話，結果如下：

MatConvNet卷積神經網路（四）——用自己的資料訓練

嘗試過從Matconvnet官網上下載的已經訓練好的神經網路之後，最近自己訓練了能夠識別果樹上紅蘋果的神經網路。先上圖。原始碼放在https://github.com/YunpengZhai/MATCONVNET 10/21/2016 更新：把滑動窗的程式碼放到了githu

MatConvNet卷積神經網路（三）【影象滑動窗】

利用滑動窗搜尋影象中的特定內容 Matconvnet官方給出的神經網路分類器imagenet-googleNet-dag.mat已經具備了較強的識別能力，能識別1000種標籤。利用它再編寫一個滑動窗

（CNN）卷積神經網路（四）dropout

第一篇文章介紹了卷積神經網路的資料輸入形式和權值的初始化：CNN）卷積神經網路（一）第二篇文章介紹了卷積操作，常用的啟用函式（CNN）卷積神經網路（二）第三篇介紹了卷積神經網路的池化層，視覺化理解以及用數學的角度理解卷積操作：（CNN）卷積神經網路（三)

卷積神經網路（四）：學習率、權重衰減、動量

學習率、權重衰減、動量被稱為超引數，因為他們不是由網路訓練而得到的引數權重衰減 L2正則化就是在代價函式後面再加上一個正則化項： C0代表原始的代價函式，後面那一項就是L2正則化項，λ就是權重衰減項。作用：防止過擬合原理：一個所謂“顯

搭建簡單圖片分類的卷積神經網路（二）-- CNN模型與訓練

一、首先，簡單來說CNN卷積神經網路與BP神經網路主要區別在於： 1、網路的層數的多少（我這裡的CNN是比較簡單的，層數較少，真正應用的話，層數是很多的）。 2、CNN名稱來說，具有卷積運算的特點，對於大型的圖片或者數量多的圖片，卷積運算可以大量提高計算效能，而BP神經網路大都為全連線層，計

tensorflow 學習專欄（六）：使用卷積神經網路（CNN）在mnist資料集上實現分類

卷積神經網路（Convolutional Neural Network, CNN）是一種前饋神經網路，它的人工神經元可以響應一部分覆蓋範圍內的周圍單元，對於大型影象處理有出色表現。卷積神經網路CNN的結構一般包含這幾個層：輸入層：用於資料的輸入卷積層：使用卷積核進行特徵提取和

Deep learning with Theano 官方中文教程（翻譯）（四）—— 卷積神經網路（CNN）

供大家相互交流和學習，本人水平有限，若有各種大小錯誤，還請巨牛大牛小牛微牛們立馬拍磚，這樣才能共同進步！若引用譯文請註明出處http://www.cnblogs.com/charleshuang/。文章中的程式碼截圖不是很清晰，可以去上面的原文網址去檢視。 1、動機卷積神經網路（CNN

十四、卷積神經網路（1）：介紹卷積神經網路

本篇部落格主要內容參考圖書《神經網路與深度學習》，李航博士的《統計學習方法》National Taiwan University (NTU)李巨集毅老師的《Machine Learning》的課程，在下文中如果不正確的地方請積極指出。如果喜歡請點贊

卷積神經網路（CNN）標準模型分析（四）

卷積神經網路的變種模型（一）卷積神經網路可以改變輸入的形式，比如說把一副影象的R、G、B三個通道看做一個整體輸入，並且採用3D的卷積核，建立3D卷積神經網路模型，以處理視訊影象。（二）卷積神經網路可以採用重疊池化來進行下采樣，比如在AlexNet中就採用

卷積神經網路（CNN）在語音識別中的應用

卷積神經網路（CNN）在語音識別中的應用作者：侯藝馨前言總結目前語音識別的發展現狀，dnn、rnn/lstm和cnn算是語音識別中幾個比較主流的方向。2012年，微軟鄧力和俞棟老師將前饋神經網路FFDNN（Feed Forward Deep Neural Network）引入到聲學模

卷積神經網路（CNN）_相關知識

斯坦福公開課 CS231n Convolutional Neural Networks for Visual Recognition ： http://cs231n.stanford.edu/syllabus.html 網路引數初始化：https://www.cnblogs.com/yinheyi

卷積神經網路（CNN）一之概念原理

　　什麼是卷積神經網路呢？這個的確是比較難搞懂的概念，特別是一聽到神經網路，大家腦海中第一個就會想到複雜的生物學，讓人不寒而慄，那麼複雜啊．卷積神經網路是做什麼用的呢？它到底是一個什麼東東呢？卷積神經網路的靈感源一種生物程序，其中神經元之間的聯結模式和動物視覺皮層組織非常相似。所以發明者把它叫做卷積神經網

機器學習之卷積神經網路（九）

摘要：　　卷積神經網路（Convolutional Neural Network,CNN）是一種前饋神經網路，它的人工神經元可以響應一部分覆蓋範圍內的周圍單元，對於大型影象處理有出色表現。引言：　　在傳統的機器學習中，通常是我們自己來尋找特徵，而深度學習中我們通過神經網路來自主的學習特診。在大量資

【6年人工智慧開發】簡述卷積神經網路（CNN）

在百度做了6年人工智慧方面的程式設計開發，也有很多這方面的經驗吧，從古至今，機器人一直承載著人類巨大的夢想。隨著各類感測器、語音互動、機器識別、SLAM等技術的蓬勃發展，機器人開始從科幻作品中走出

搭建簡單圖片分類的卷積神經網路（三）-- 模型的測試和運用

兩個功能都在同一個檔案中一、新建Disimage.py檔案 import tensorflow as tf from PIL import Image import os import numpy as np import matplotlib.pyplot as plt from Get

搭建簡單圖片分類的卷積神經網路（一）-- 訓練模型的圖片資料預處理

一、訓練之前資料的預處理主要包括兩個方面 1、將圖片資料統一格式，以標籤來命名並存到train資料夾中（假設原始圖片按類別存到資料夾中）。 2、對命名好的圖片進行訓練集和測試集的劃分以及圖片資料化。先對整個專案檔案進行說明：專案資料夾

用於說明卷積神經網路（ConvNet）的Python指令碼

借鑑：https://github.com/gwding/draw_convnet 直接上程式碼： import os import numpy as np import matplotlib.pyplot as plt plt.rcdefaults() from matplotlib.li

卷積神經網路（4）----目標檢測

一、分類、定位和檢測簡單來說，分類、定位和檢測的區別如下：分類：是什麼？定位：在哪裡？是什麼？（單個目標）檢測：在哪裡？分別是什麼？（多個目標） (1)目標分

卷積神經網路（CNN）基礎

CNN的基本結構原文地址：https://www.jianshu.com/p/da0c4cc76a06 CNN分為幾層 CNN一共有卷積層（CONV）、ReLU層（ReLU）、池化層（Pooling）、全連線層（FC（Full Connection））下面是各個層的

吳恩達深度學習筆記（deeplearning.ai）之卷積神經網路（CNN）（上）

1. Padding 在卷積操作中，過濾器（又稱核）的大小通常為奇數，如3x3，5x5。這樣的好處有兩點：在特徵圖（二維卷積）中就會存在一箇中心畫素點。有一箇中心畫素點會十分方便，便於指出過濾器的位置。在沒有padding的情況下，經過卷積操作，輸出的資

MatConvNet卷積神經網路（四）——用自己的資料訓練

相關推薦