MXNet | 手寫字MNIST識別比賽

阿新 • • 發佈：2019-01-26

MNIST手寫字圖片資料集由Yann LeCun建立，每條資料表示28*28畫素的圖片。它已經是用於衡量分類器在簡單圖片作為輸入的標準資料集。神經網路是對於圖片分類任務來說是強大的模型。這是一個在kaggle長期舉辦的比賽資料集。

讀取資料集，這裡用readr中的函式read_csv，讀取速度快高效

setwd("F:\\迅雷下載\\mnist")

require(mxnet)
library(readr)
train <- read_csv('train.csv')
test <- read_csv('test.csv')

資料集：訓練集和測試集

> train <- data 
.matrix(train)
> test <- data.matrix(test)
> train.x <- train[,-1]
> train.y <- train[,1]
> train <- data.matrix(train)
> test <- data.matrix(test)
> train.x <- train[,-1]
> train.y <- train[,1]

資料放縮到[0,1]

> train.x <- t(train.x/255)
> test <- t(test/255)

標籤

> table(train.y)
train.y
   0    1    2    3    4    5    6    7    8    9 
4132 4684 4177 4351 4072 3795 4137 4401 4063 4188

資料集還是比較平衡，不同之間的差異不大

構建網路

#定義
> data <- mx.symbol.Variable("data")
#第一層，全連線，隱藏節點128個
> fc1 <- mx.symbol.FullyConnected(data, name="fc1", num_hidden=128)
#啟用函式為relu 

> act1 <- mx.symbol.Activation(fc1, name="relu1", act_type="relu")
#第二層，隱藏節點為64個
> fc2 <- mx.symbol.FullyConnected(act1, name="fc2", num_hidden=64)
#啟用函式為relu
> act2 <- mx.symbol.Activation(fc2, name="relu2", act_type="relu")
#第三層，隱藏節點為10個
> fc3 <- mx.symbol.FullyConnected(act2, name="fc3", num_hidden=10)
##啟用函式為sm，即softmax
> softmax <- mx.symbol.SoftmaxOutput(fc3, name="sm")

訓練，採用cpu的方式

#cpu
>devices <- mx.cpu()
#隨機種子
>mx.set.seed(0)
#模型
>model <- mx.model.FeedForward.create(softmax, X=train.x, y=train.y,
                                     ctx=devices, num.round=10, array.batch.size=100,
                                     learning.rate=0.07, momentum=0.9,  eval.metric=mx.metric.accuracy,
                                     initializer=mx.init.uniform(0.07),
                                     epoch.end.callback=mx.callback.log.train.metric(100))

Start training with 1 devices
[1] Train-accuracy=0.859832935560859
[2] Train-accuracy=0.957666666666668
[3] Train-accuracy=0.971023809523813
[4] Train-accuracy=0.977714285714289
[5] Train-accuracy=0.981571428571432
[6] Train-accuracy=0.986309523809527
[7] Train-accuracy=0.988952380952383
[8] Train-accuracy=0.990880952380956
[9] Train-accuracy=0.992142857142861
[10] Train-accuracy=0.991095238095241

訓練的精度為99.10%

預測

> preds <- predict(model, test)
> dim(preds)
[1]    10 28000
> pred.label <- max.col(t(preds)) - 1

預測後的類別

> table(pred.label)
pred.label
   0    1    2    3    4    5    6    7    8    9 
2816 3216 2753 2791 2709 2544 2762 2836 2780 2793

得到提交的資料集ID和label

submission <- data.frame(ImageId=1:ncol(test), Label=pred.label)
write.csv(submission, file='submission.csv', row.names=FALSE,  quote=FALSE)

submission.csv檔案在你的工作目錄下，然後去kaggle提交下。

結果顯示

下面給出完整的程式碼：

setwd("F:\\迅雷下載\\mnist")

require(mxnet)
library(readr)
train <- read_csv('train.csv')
test <- read_csv('test.csv')

train <- data.matrix(train)
test <- data.matrix(test)

train.x <- train[,-1]
train.y <- train[,1]

# 資料放縮到[0,1]
train.x <- t(train.x/255)
test <- t(test/255)

table(train.y)


#構建網路
data <- mx.symbol.Variable("data")
fc1 <- mx.symbol.FullyConnected(data, name="fc1", num_hidden=128)
act1 <- mx.symbol.Activation(fc1, name="relu1", act_type="relu")
fc2 <- mx.symbol.FullyConnected(act1, name="fc2", num_hidden=64)
act2 <- mx.symbol.Activation(fc2, name="relu2", act_type="relu")
fc3 <- mx.symbol.FullyConnected(act2, name="fc3", num_hidden=10)
softmax <- mx.symbol.SoftmaxOutput(fc3, name="sm")

########訓練
##cpu
devices <- mx.cpu()

mx.set.seed(0)
model <- mx.model.FeedForward.create(softmax, X=train.x, y=train.y,
                                     ctx=devices, num.round=10, array.batch.size=100,
                                     learning.rate=0.07, momentum=0.9,  eval.metric=mx.metric.accuracy,
                                     initializer=mx.init.uniform(0.07),
                                     epoch.end.callback=mx.callback.log.train.metric(100))


#預測
preds <- predict(model, test)
dim(preds)

pred.label <- max.col(t(preds)) - 1
table(pred.label)


submission <- data.frame(ImageId=1:ncol(test), Label=pred.label)
write.csv(submission, file='submission.csv', row.names=FALSE,  quote=FALSE)

MXNet | 手寫字MNIST識別比賽

MNIST手寫字圖片資料集由Yann LeCun建立，每條資料表示28*28畫素的圖片。它已經是用於衡量分類器在簡單圖片作為輸入的標準資料集。神經網路是對於圖片分類任務來說是強大的模型。這是一個在kaggle長期舉辦的比賽資料集。讀取資料集，

深度學習-tensorflow學習筆記(2)-MNIST手寫字體識別

image utf-8 詳情識別標簽 ins AI tor 第一個　　　　　　　　　　深度學習-tensorflow學習筆記(2)-MNIST手寫字體識別　　這是tf入門的第一個例子。minst應該是內置的數據集。　　前置知識在學習筆記(1)裏面講過了　　這裏直

開源標準資料集 —— mnist（手寫字元識別）

使用 python 讀取和解析 mnist.pkl.gz import pickle import gzip def load_data(): with gzip.o

利用Tensorflow實現手寫字符識別

status ade 模式數學 malloc interact tutorials x模型項目模式識別領域應用機器學習的場景非常多，手寫識別就是其中一種，最簡單的數字識別是一個多類分類問題，我們借這個多類分類問題來介紹一下google最新開源的tensorflow框架

機器學習之路： python 支持向量機手寫字體識別

1.0 tar 下載分類字體 ID 導入所有 load 使用python3 學習sklearn中支持向量機api的使用可以來到我的git下載源代碼：https://github.com/linyi0604/kaggle 1 # 導入手寫字體加載器 2

【TensorFlow】3-2構建簡單單層神經網路進行【手寫字元識別】

自動下載並轉化MNIST資料集格式到TF中 import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data #載入MNIST資料集，如果不存在，將自動在預設網址

python線上神經網路實現手寫字元識別系統

神經網路實現手寫字元識別系統一、課程介紹1. 課程來源課程內容在原文件基礎上做了稍許修改，增加了部分原理介紹，步驟的拆解分析及原始碼註釋。2. 內容簡介本課程最終將基於BP神經網路實現一個手寫字元識別系統，系統會在伺服器啟動時自動讀入訓練好的神經網路檔案，如果檔案不存在，則讀入

computer version之手寫字元識別初探——以matlab和python（tensorflow）分別示例（2）

承接前文，繼續。下面探討以tensorflow框架進行mnist資料集中的字元識別。（題外話：目前中文社群越來越健全和完善了，tensorflow的中文社群就很讓人滿意，今天的內容就是基於此的。http://www.tensorfly.cn/）在此t

computer version之手寫字元識別初探——以matlab和python（tensorflow）分別示例（1）

昨晚2017.04.03趁清明假期再次嘗試了以qq群視訊的形式進行科研班會，主要內容講解演示了computer version（計算機視覺）中關於手寫字元的識別，並分別以matlab和python進行講解。其中matlab40min，python40min。

利用BP神經網路實現手寫字元識別

利用python實現的BP神經網路，進行手寫字元識別，訓練與測試資料集為mnist，若實現UI介面需要安裝pyqt5。程式碼開源在個人的github：https://github.com/SpyderXu/BP_mnist_UI效果：

mnist手寫字識別及tensorflow與tflearn對比

一、mnist機器學習入門 MNIST是一個入門級的計算機視覺資料集，它包含各種手寫數字圖片：它也包含每一張圖片對應的標籤，告訴我們這個是數字幾。比如，上面這四張圖片的標籤分別是5，0，4，1。在此教程中，我們將訓練一個機器學習模型用於預測圖片裡面的數字。我們的

Tensorflow | MNIST手寫字識別

這次對最近學習tensorflow的總結，以理解MNIST手寫字識別案例為例來說明 0、資料解釋資料為圖片，每個圖片是28畫素*28畫素，帶有標籤，類似於X和Y，X為28畫素*28畫素的資料，Y為該圖片的真實數字，即標籤。 1、資料的處理

TensorFlow實現多層LSTM識別MNIST手寫字，多層LSTM下state和output的關係

其他內容輸入格式：batch_size*784改成batch_size*28*28,28個序列，內容是一行的28個灰度數值。讓神經網路逐行掃描一個手寫字型圖案，總結各行特徵，通過時間序列串聯起來，最終得出結論。網路定義：單獨定義一個獲取單元的函式，便於在M

MFC基於對話框手寫數字識別 SVM+MNIST數據集

識別數字做了 XML svm 簡單實用清空朋友 detail data 完整項目下載地址： http://download.csdn.net/detail/hi_dahaihai/9892004 本項目即拿MFC做了一個畫板，畫一個數字後可自行識別數字。此外還有保存

Tensorflow實踐 mnist手寫數字識別

model 損失函數兩層最簡 sin test http gif bat minst數據集　　　　tensorflow的文檔中就自帶了mnist手寫數字識別的例子，是一個很經典也比較簡單

人工智能 tensorflow框架-->MNIST手寫字符數據集 06

推廣 x文件數據集 2.4 mage esx cnblogs -i 向量空間 1.下載MNIST數據集： 2.1數據集分成兩部分：60000行的訓練集 trainxxx （包含手寫數字的圖片imagexxx 和手寫數字對應的標簽labelxxx）

tensorflow 基礎學習五：MNIST手寫數字識別

truncate averages val flow one die correct 表示 data MNIST數據集介紹： from tensorflow.examples.tutorials.mnist import input_data # 載入MNIST數據集，

如何快速使用Python神經網絡識別手寫字符？(文末福利)

Python 神經網絡點擊標題下[異步社區]可快速關註在本文中，我們將進一步探討一些使用Python神經網絡識別手寫字符非常有趣的想法。如果只是想了解神經網絡的基本知識，那不必閱讀本文,可以先閱讀《Python神經網絡編程》前面2章節的內容。這是一個有趣的額外部分，所以節奏會稍微加快一些，但是我們仍

Caffe的運行mnist手寫數字識別

而不是所在結果 ack cif sting one efi 打開老規矩，首先附上官方教程：http://caffe.berkeleyvision.org/gathered/examples/mnist.html 1、必要軟件　　因為Caffe中使用的是Linux才能

caffe的python接口學習（4）mnist實例手寫數字識別

數字 interval with lac EDA 變化 mode 指數 lB 以下主要是摘抄denny博文的內容，更多內容大家去看原作者吧　　一數據準備　　準備訓練集和測試集圖片的列表清單; 　　二導入caffe庫，設定文件路徑　　 # -*- coding: u

MXNet | 手寫字MNIST識別比賽

相關推薦