matlab手寫神經網路實現識別手寫數字

阿新 • • 發佈：2019-01-03

實驗說明

一直想自己寫一個神經網路來實現手寫數字的識別，而不是套用別人的框架。恰巧前幾天，有幸從同學那拿到5000張已經貼好標籤的手寫數字圖片，於是我就嘗試用matlab寫一個網路。

實驗資料：5000張手寫數字圖片（.jpg)，圖片命名為1.jpg,2.jpg…5000.jpg。還有一個放著標籤的excel檔案。
資料處理：前4000張作為訓練樣本，後1000張作為測試樣本。
圖片處理：用matlab的imread（）函式讀取圖片的灰度值矩陣（28，28），然後把每張圖片的灰度值矩陣reshape為（28*28，1），然後把前4000張圖片的灰度值矩陣合併為x_train，把後1000張圖片的灰度值矩陣合併為x_test。

數字圖片截圖

神經網路設計

網路層設計：一層隱藏層，一層輸出層
輸入層：一張圖片的灰度值矩陣reshape後的784個數，也就是x_train中的某一列
輸出層：（10，1）的列向量，其中列向量中最大的數所在的索引就是預測的數字
激勵函式：sigmoid函式（公式)
更新法則：後向傳播演算法（參考）
一點說明：這裡的訓練我分別用了普通梯度下降法和mini_batch（batch size 為10）梯度下降法來實現
測試：用了兩種方式表示正確率，一是統計預測正確的個數，而是利用matlab的plotconfusion函式

網路實現

全部實現包括5個函式(gedata.m / layerout.m / mytrain.m / mytrain_mini.m / test.m)和一個main.m檔案。

讀取資料（getdata.m）

function[x_train,y_train,x_test,y_test]=getdata()
%把圖片變成畫素矩陣
%path :圖片路徑 
% x_train:訓練樣本畫素矩陣(784,4000)
%y_train:訓練樣本標籤(10,4000)
%x_test:測試樣本畫素矩陣(784,1000)
%y_test:測試樣本標籤(10,1000)


% photopath = './photo/';
% snames=dir([photopath  '*' '.jpg'])%get all filenames in photopath
% l = length(snames) 

% 
% %get x_ data
% x_train = [];
% x_test = [];
% 
% for i=1:4000
%     iname=[photopath snames(i).name] %the path of jpg
%     x = imread(iname);  % the shape of x is (28,28)
%     x = reshape(x,784,1);  %reshape x to (784,1)
%     x_train = [x_train,x];
% end
% 
% for k=4001:5000
%     kname=[photopath snames(k).name];  %the path of jpg
%     x = imread(kname);   %the shape of x is (28,28)
%     x = reshape(x,784,1);  %reshape x  to (784,1)
%     x_test = [x_test,x];
% end

x_train=[];

for i=1:4000
      x=im2double(imread(strcat(num2str(i),'.jpg')));
      x=reshape(x,784,1);
      x_train=[x_train,x];
end
x_test =[];

for k=4001:5000
      x=im2double(imread(strcat(num2str(k),'.jpg')));
      x=reshape(x,784,1);
      x_test=[x_test,x];
end
data=xlsread('label.xlsx');
y_train=data(:,1:4000);
y_test = data(:,4001:5000);

x_train;
y_train;
x_test;
y_test;

end

這裡踩了一個坑。我本來讀取圖片，是按目錄來讀取的，然後訓練出來的效果一直不好。一度懷疑自己的更新函式寫錯了，改了很久，才發現按目錄讀取的圖片順序是錯誤的！按目錄讀取的圖片並不是按1，2，3…這樣讀的，而是按下面的順序讀取的，這樣就和label對不上了！！！

layerout函式

function [y] = layerout(w,b,x)
%output function
y = w*x + b;
n = length(y);
for i =1:n
    y(i)=1.0/(1+exp(-y(i)));
end
y;
end

訓練一（mytrain.m）

function[w,b,w_h,b_h]=mytrain(x_train,y_train)
%train function:設定一個隱藏層，784-->隱藏層神經元個數-->10
%x_train:訓練樣本的畫素資料
%y_train：訓練樣本的標籤
%w：輸出層權重
%b：輸出層偏置
%w_h：隱藏層權重
%b_h：隱藏層偏置
%step：迴圈步數

step=input('迭代步數：');
a=input('學習因子：');
in = 784; %輸入神經元個數
hid = input('隱藏層神經元個數：');%隱藏層神經元個數
out = 10; %輸出層神經元個數
o =1;

w = randn(out,hid);
b = randn(out,1);
w_h =randn(hid,in);
b_h = randn(hid,1);


for i=0:step
    %打亂訓練樣本
    r=randperm(4000);
    x_train = x_train(:,r);
    y_train = y_train(:,r);

    for j=1:4000
        x = x_train(:,j);
        y = y_train(:,j);

        hid_put = layerout(w_h,b_h,x);
        out_put = layerout(w,b,hid_put);

        %更新公式的實現
        o_update = (y-out_put).*out_put.*(1-out_put);
        h_update = ((w')*o_update).*hid_put.*(1-hid_put);

        outw_update = a*(o_update*(hid_put'));
        outb_update = a*o_update;
        hidw_update = a*(h_update*(x'));
        hidb_update = a*h_update;

        w = w + outw_update;
        b = b+ outb_update;
        w_h = w_h +hidw_update;
        b_h =b_h +hidb_update;
    end
end  
end

訓練二（mytrain_mini.m）

function[w,b,w_h,b_h]=mytrain_mini(x_train,y_train)
%train function:設定一個隱藏層，784-->隱藏層神經元個數-->10
%x_train:訓練樣本的畫素資料
%y_train：訓練樣本的標籤
%w：輸出層權重
%b：輸出層偏置
%w_h：隱藏層權重
%b_h：隱藏層偏置
%step：迴圈步數

step=ipout('迭代步數：');
a=input('學習因子：');
in = 784; %輸入神經元個數
hid = input('隱藏層神經元個數：');%隱藏層神經元個數
out = 10; %輸出層神經元個數
o =1;

w = randn(out,hid);
b = randn(out,1);
w_h =randn(hid,in);
b_h = randn(hid,1);


for i=0:step
    %打亂訓練樣本
    r=randperm(4000);
    x_train = x_train(:,r);
    y_train = y_train(:,r);
    %mini_batch
    for jj=0:399
        %取batch為10  更新取10次的平均值
        for j=jj*10+1:(jj+1)*10
            x = x_train(:,j);
            y = y_train(:,j);

            hid_put = layerout(w_h,b_h,x);
            out_put = layerout(w,b,hid_put);

            %更新公式的實現
            o_update = (y-out_put).*out_put.*(1-out_put);
            h_update = ((w')*o_update).*hid_put.*(1-hid_put);

            if j==1
                outw_update = (double(a)/10)*(o_update*(hid_put'));
                outb_update = (double(a)/10)*o_update;
                hidw_update = (double(a)/10)*(h_update*(x'));
                hidb_update = (double(a)/10)*h_update;
            end

            if j~=1
                outw_update = outw_update + (double(a)/10)*(o_update*(hid_put'));
                outb_update = outb_update -(double(a)/10)*o_update;
                hidw_update = hidw_update + (double(a)/10)*(h_update*(x'));
                hidb_update = hidb_update -(double(a)/10)*h_update;
            end
        end

        w = w + outw_update;
        b = b+ outb_update;
        w_h = w_h +hidw_update;
        b_h =b_h +hidb_update;
    end  
end
end

測試（mytest.m）

function[]= mytest(x_test,y_test,w,b,w_h,b_h)
%x_test:測試樣本的畫素資料
%y_test：測試樣本的標籤
%w：輸出層權重
%b：輸出層偏置
%w_h：隱藏層權重
%b_h：隱藏層偏置

test = zeros(10,1000);
for k=1:1000
    x = x_test(:,k);

    hid = layerout(w_h,b_h,x);
    test(:,k)=layerout(w,b,hid);

    %正確率表示方式一：輸出正確個數
    [t,t_index]=max(test);
    [y,y_index]=max(y_test);
    sum = 0;
    for p=1:length(t_index)
        if t_index(p)==y_index(p)
            sum =sum+1;
        end
    end
end

fprintf('正確率: %d/1000\n',sum);

%正確率表示方式二：用plotconfusion函式
plotconfusion(y_test,test);
end

main.m

[x_train,y_train,x_test,y_test]=getdata();

%歸一化
x_train = mapminmax(x_train,0,1);
x_test =mapminmax(x_test,0,1);

[w1,b1,w_h1,b_h1]=mytrain(x_train,y_train);
fprintf('mytrain正確率:\n');
mytest(x_test,y_test,w1,b1,w_h1,b_h1);

[w2,b2,w_h2,b_h2]=mytrain(x_train,y_train);
fprintf('mytrain_mini正確率:\n');
mytest(x_test,y_test,w2,b2,w_h2,b_h2);

實驗結果

直接執行main.m，且兩個訓練方式都輸入相同引數，得到結果如下：

下面是mini_batch的plotconfusion結果，mytrain的也差不多。其中綠色的為正確率：
mytrain_mini

直觀感覺min_batch方式的訓練會快一丟丟。由於這裡資料不多，所以兩者的差別看不大出來！

matlab手寫神經網路實現識別手寫數字

實驗說明一直想自己寫一個神經網路來實現手寫數字的識別，而不是套用別人的框架。恰巧前幾天，有幸從同學那拿到5000張已經貼好標籤的手寫數字圖片，於是我就嘗試用matlab寫一個網路。實驗資料：5000張手寫數字圖片（.jpg)，圖片命名為1.jpg,2.

python手寫神經網路實現識別手寫數字

實驗說明一直想自己寫一個神經網路來實現手寫數字的識別，而不是套用別人的框架。恰巧前幾天，有幸從同學那拿到5000張已經貼好標籤的手寫數字圖片，於是我就嘗試用matlab寫一個網路。實驗資料：5000張手寫數字圖片（.jpg)，圖片命名為

全連線神經網路實現識別手寫資料集MNIST

全連線神經網路實現識別手寫資料集MNIST MNIST是一個由美國由美國郵政系統開發的手寫數字識別資料集。手寫內容是0~9，一共有60000個圖片樣本，我們可以到MNIST官網免費下載。總共4個檔案，該檔案是二進位制內容。 train-images-idx3-ubyte.gz: trainin

神經網路實現Mnist手寫數字識別筆記

目錄 1.Mnist手寫數字識別介紹 Mnist手寫數字識別是Kaggle上一個很經典的機器學習資料集，裡邊包括55000張訓練資料和10000張圖片的測試資料，每張圖片大小為28*28畫素的單通圖片。該任務為通過機器學習來識別圖片中的

深度學習：tensorflow入門：卷積神經網路實現MNIST手寫字型識別

程式碼中./data/mnist/input_data/為真實MNIST資料集的路徑 import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data # 定義

Tensorflow卷積神經網路實現MNIST手寫資料集識別

模型建的不好，最終只有85%左右的準確率，後面繼續改進吧 #卷積神經網路API 卷積層：tf.nn.conv2d(input, #輸入張量，具有[batch, height, width, chann

PyTorch基礎入門六：PyTorch搭建卷積神經網路實現MNIST手寫數字識別

1）卷積神經網路(CNN)簡介關於什麼是卷積神經網路(CNN)，請自行查閱資料進行學習。如果是初學者，這裡推薦一下臺灣的李巨集毅的深度學習課程。連結就不給了，這些資料網站上隨處可見。值得一提的是，CNN雖然在影象處理的領域具有不可阻擋的勢頭，但是它絕對不僅僅只能用來影

全連線神經網路實現MNIST手寫資料集識別

有目錄，內容大部分從官方教程copy，黑體加粗為對官方教程的補充 TensorFlow,pytorch,cuda,cudnn,anaconda安裝版本對應關係 Version Python version Compiler Build tools cu

深度學習入門——利用卷積神經網路實現MNIST手寫數字識別

MNIST（Modified National Institute of Standards and Technology）資料庫是一個大型手寫數字資料庫，通常用於訓練各種影象處理系統。該資料庫還廣泛用於機器學習領域的培訓和測試。它是通過重新打亂來自NIST原始資料集的樣本而

如何用卷積神經網路CNN識別手寫數字集BaseLine版本超級小白註釋

如何用卷積神經網路CNN識別手寫數字集？由於剛剛開始學習機器學習方面的知識，網上很多基礎的教程真的看不懂，所以只能自己一點點摸索，一篇很簡單的程式碼，可能我也要看很久QAQ，原博主的程式碼對於我來說可能還是很懵逼，因此自己加了很多註釋，希望可以幫到和我一樣的

KEARS 神經網路學習識別手寫文字

2018年11月13日 10:57:15 mailjmq 閱讀數：5 標籤： KEARS 識別手寫

第一章用神經網路來識別手寫數字(1)

寫在章節前面的翻譯文章來源人類的識別系統是世界上的一大奇蹟，看下面的一串手寫數字大部分人都能準確地認出這些數字是504192，這是很容易的。在大腦的每個半球，人類都有一個被稱為V1的視覺皮層，其中包含了超過140,000,000個

[純C#實現]基於BP神經網路的中文手寫識別演算法

效果展示這不是OCR,有些人可能會覺得這東西會和OCR一樣,直接進行整個字的識別就行,然而並不是. OCR是2維畫素矩陣的畫素資料.而手寫識別不一樣,手寫可以把使用者寫字的筆畫時間順序,抽象成一個維度.這樣識別的就是3維的資料了.識別起來簡單很多. 最近需要做一箇中文手寫識別演算法.搜尋了網上的

用python的numpy實現神經網路實現手寫數字識別

首先是讀取檔案，train-images-idx3-ubyte等四個檔案是mnist資料集裡的資料。放在MNIST資料夾裡。MNIST資料夾和這個.py檔案放在同一個資料夾裡。 import numpy as np import struct train_images

python手寫bp神經網路實現人臉性別識別1.0

寫在前面：本實驗用到的圖片均來自google圖片，侵刪！實驗介紹用python手寫一個簡單bp神經網路，實現人臉的性別識別。由於本人的機器配置比較差，所以無法使用網上很紅的人臉大資料資料集（如lfw資料集等等），所以我從google圖片下載了一些

邏輯迴歸softmax神經網路實現手寫數字識別(cs)

邏輯迴歸softmax神經網路實現手寫數字識別全過程 1 - 匯入模組 import numpy as np import matplotlib.pyplot as plt from ld_mnist import load_digits

C++使用matlab卷積神經網路庫MatConvNet來進行手寫數字識別

環境：WIN10(64 bit)+VS2010(64 bit)+Matlab2015b(64 bit) 我們的目的是將MatConvNet自帶的手寫數字識別DEMO移植到一個簡單的WIN32 DEMO中使用，主要過程有以下幾個步驟：（1）配置MatConvNet

【MATLAB】BP神經網路識別MNIST手寫數字

一.Summary本文運用BP神經網路對MNIST手寫數字字元進行識別。BP神經網路是通過樣本以及期望輸出不斷調整權值以達到訓練的目的的演算法。本文采用三層BP神經網路對MNIST字元進行訓練，然後對提供的資料進行測試。二.Content1. 分析BP神經網路的基本原理：通過

lesson22-24 MNIST資料集，模組化搭建神經網路八股，手寫數字識別準確率輸出

import tensorflow as tf #MNIST資料集輸出識別準確率 #MNIST資料集： #提供6w張28*28畫素點的0-9手寫數字圖片和標籤，用於訓練 #提供1w張28*28畫素點的0-9手寫數字圖片和標籤，用於測試 #每張圖片的784個畫素點（

python線上神經網路實現手寫字元識別系統

神經網路實現手寫字元識別系統一、課程介紹1. 課程來源課程內容在原文件基礎上做了稍許修改，增加了部分原理介紹，步驟的拆解分析及原始碼註釋。2. 內容簡介本課程最終將基於BP神經網路實現一個手寫字元識別系統，系統會在伺服器啟動時自動讀入訓練好的神經網路檔案，如果檔案不存在，則讀入

matlab手寫神經網路實現識別手寫數字

實驗說明

神經網路設計

網路實現

讀取資料（getdata.m）

layerout函式

訓練一（mytrain.m）

訓練二（mytrain_mini.m）

測試（mytest.m）

main.m

實驗結果

相關推薦