【機器學習】手寫數字識別算法

阿新 • • 發佈：2017-07-30

alt gdi 數字識別 -1 轉換 error: erro files turn

1.數據準備

樣本數據獲取忽略，實際上就是將32*32的圖片上數字格式化成一個向量，如下：

技術分享

本demo所有樣本數據都是基於這種格式的

訓練數據：將圖片數據轉成1*1024的數組，作為一個訓練數據。

訓練數據集：https://github.com/zimuqi/machine_Learning/tree/master/ch02/trainingDigits

測試數據集：https://github.com/zimuqi/machine_Learning/tree/master/ch02/testDigits

樣本的文件名格式為：真實值_xxx.txt

轉換代碼：

1 def img2vector(filename):
2     returnVect=zeros((1,1024))
 
3     fr=open(filename)
4     for i in range(32):
5         lineStr=fr.readline()
6         for j in range(32):
7             returnVect[0,32*i+j]=int(lineStr[j])
8     return returnVect

2.測試算法

 1 def handwritingClassTest():
 2     hwLabels=[]    # 訓練樣本的標簽數組
 3     traningFileList=listdir("trainingDigits 
")    # 獲取所有的訓練樣本目錄下的文件名
 4     m=len(traningFileList)
 5     traningMat=zeros((m,1024))    # 初始化訓練樣本數列
 6 
 7     for i in range(m):
 8         fileNameStr=traningFileList[i]    # 獲取文件名
 9         fileStr=fileNameStr.split(".")[0]   
10         clasNumStr=int(fileStr.split("_")[0])    # 獲取樣本的實際值 放入標簽數組 

11         hwLabels.append(clasNumStr)
12         traningMat[i,:]=img2vector("trainingDigits/{}".format(fileNameStr))    # 將樣本轉化成1*1024的行放入訓練樣本數列
13 
14     testFileList=listdir("testDigits")    # 測試樣本目錄
15     error=0
16     mtest=len(testFileList)
17     for i in range(mtest):
18         fileNameStr=testFileList[i]
19         fileStr=fileNameStr.split(".")[0]
20         clasNumStr=int(fileStr.split("_")[0])
21         testMat=img2vector("testDigits/{}".format(fileNameStr))
22         res=classify(testMat,traningMat,hwLabels,3)     # 使用分類器分類
23         print "came bank with:{} the real anwser is:{}".format(clasNumStr,res)
24         if clasNumStr!=res:    # 對比與真實的結果 計算錯誤率
25             error+=1
26 
27     print "total:{}".format(mtest)
28     print "error:{}".format(error)
29     print "error:{}".format(float(error/mtest))

這個案例中算法的識別率為：98.84%

classify是分類器 上上一篇文章中有寫到，具體了解可以點擊這裏

【機器學習】手寫數字識別算法

alt gdi 數字識別 -1 轉換 error: erro files turn 1.數據準備樣本數據獲取忽略，實際上就是將32*32的圖片上數字格式化成一個向量，如下：本demo所有樣本數據都是基於這種格式的訓練數據：將圖片數據轉成1*1024的數組，作為一

機器學習--knn手寫數字識別系統

0.k近鄰演算法剛接觸java，並且在學習機器學習的相關演算法，knn又非常的易於實現，於是就有了這個小系統。 1.knn演算法簡介：存在一個樣本資料集合，也稱為訓練樣本集，並且樣本集中的每一個數據都有標籤，即我們知道樣本集中的每一個數據的特徵和對應的型別。當輸入沒有標

【機器學習 sklearn】手寫數字識別 SVM

執行結果： "D:\Program Files\Python27\python.exe" D:/PycharmProjects/sklearn/SVM.py (1797L, 64L) [[ 0. 0. 5. ..., 0. 0. 0.]

【Python例項第20講】手寫數字識別問題的K-Means聚類

機器學習訓練營——機器學習愛好者的自由交流空間（qq 群號：696721295）在這個例子裡，我們在手寫數字識別資料集上，比較 K-means 聚類演算法對於不同的初始化策略對執行時間和結果質量的影響。我們也利用不同的聚類質量測度判別聚類標籤對於參考標籤的擬合優度。這裡使

[分享] Python實現的基於深度學習的手寫數字識別演算法

本文將採用深度學習中的卷積神經網路來訓練手寫數字識別模型。使用卷積神經網路建立合理的模型結構，利用卷積層中設定一定數目的卷積核（即濾波器），通過訓練資料使模型學習到能夠反映出十個不同手寫提數字特徵的卷積核權值，最後通過全連線層使用softmax函式給出預測數字圖對應每種數字可能性的概率多少。本文以學習基於

【機器學習】動手寫一個全連線神經網路（三）：分類

我們來用python寫一個沒有正則化的分類神經網路。傳統的分類方法有聚類，LR邏輯迴歸，傳統SVM，LSSVM等。其中LR和svm都是二分類器，可以將多個LR或者svm組合起來，做成多分類器。多分類神經網路使用softmax+cross entropy組

【Tensorflow入門】手寫字型識別——卷積神經網路

慣例放結果，瞬間識別率就上99.29%了…… import input_data mnist = input_data.read_data_sets('MNIST_data', one_hot=True) import tensorflow as tf sess =

【Tensorflow入門】手寫字型識別（MNIST)

轉載自：地址配置有困難的話可以直接下載：地址 //當然照著這個教程配置很輕鬆的其實，完全可以不用浪費這1積分，攤手… MNIST機器學習入門這個教程的目標讀者是對機器學習和TensorFlow都不太瞭解的新手。如果你已經瞭解MNIST和softmax

【機器學習--opencv3.4.1版本基於Hog特徵描述子Svm對經典手寫數字識別】

方向梯度直方圖（Histogram of Oriented Gradient, HOG）特徵是一種在計算機視覺和影象處理中用來進行物體檢測的特徵描述子。HOG特徵通過計算和統計影象區域性區域的梯度方向直方圖來構成特徵。 #include <iostream> #inc

機器學習框架ML.NET學習筆記【4】多元分類之手寫數字識別

一、問題與解決方案通過多元分類演算法進行手寫數字識別，手寫數字的圖片解析度為8*8的灰度圖片、已經預先進行過處理，讀取了各畫素點的灰度值，並進行了標記。其中第0列是序號（不參與運算）、1-64列是畫素值、65列是結果。我們以64位畫素值為特徵進行多元分類，演算法採用SDCA最大熵分類演算法。

【深度學習】python實現簡單神經網路以及手寫數字識別案例

前言 \quad \qu

【4】caffe的python介面學習：mnist例項---手寫數字識別

一、資料準備官網提供的mnist資料並不是圖片，但我們以後做的實際專案可能是圖片。因此有些人並不知道該怎麼辦。在此我將mnist資料進行了轉化，變成了一張張的圖片，我們練習就從圖片開始。下面是轉化的程式碼。 import numpy as np import struc

【深度學習】基於Numpy實現的神經網路進行手寫數字識別

直接先用前面設定的網路進行識別，即進行推理的過程，而先忽視學習的過程。推理的過程其實就是前向傳播的過程。深度學習也是分成兩步：學習 + 推理。學習就是訓練模型，更新引數；推理就是用學習到的引數來處理新的資料。 from keras.datasets.mnist impor

【深度學習】3：BP神經網路與MNIST資料集實現手寫數字識別

前言：這是一篇基於tensorflow框架，建立的只有一層隱藏層的BP神經網路，做的圖片識別，內容也比較簡單，全當是自己的學習筆記了。 –—-—-—-—-—-—-—-—-—-—-—-—–—-—-—-—-—-—-—-——-—-—-—-—-—-—-—-—-—-—-

【AI實戰】訓練第一個AI模型：MNIST手寫數字識別模型

在上篇文章中，我們已經把AI的基礎環境搭建好了（見文章：Ubuntu + conda + tensorflow + GPU + pycharm搭建AI基礎環境），接下來將基於tensorflow訓練第一個AI模型：MNIST手寫數字識別模型。 MNIST是一個經典的手寫數字資料集，來自美國國家

機器學習--k-近鄰演算法（kNN）實現手寫數字識別

這裡的手寫數字以0,1的形式儲存在文字檔案中，大小是32x32.目錄trainingDigits有1934個樣本。0-9每個數字大約有200個樣本，命名規則如下：下劃線前的數字代表是樣本0-9的

機器學習實戰--KNN手寫數字識別

程式碼： import numpy as np import operator import matplotlib import matplotlib.pyplot as plt import os def classfy0KNN(intX,dataset,labels

機器學習實戰——KNN演算法手寫數字識別

資料來源我們的文字是形如這樣的，每個數字都有很多txt檔案，TXT裡面是01數字，表示手寫數字的灰度圖。現在我們要用knn演算法實現數字識別。資料處理每個txt檔案都是32*32的0,1矩陣，如果要使用knn，那麼還得考慮行列關係，如果能把它拉開，只有一行，就可以不必考慮數字

OpenCV機器學習：SVM分類器實現MNIST手寫數字識別

0. 開發環境最近機器學習隨著AI人工智慧的興起越來越火，博主想找一些ML的庫來練手。突然想起之前在看Opencv的doc時發現有ML的component，於是心血來潮就開始寫程式碼試試。話不多說，直接進正題。以下我的開發環境配置： -Windows7

機器學習實戰k近鄰演算法(kNN)應用之手寫數字識別程式碼解讀

from numpy import * from os import listdir import operator import time #k-NN簡單實現函式 def classify0(inX,dataSet,labels,k): #求出樣本集的行數，也就是labels標籤的數目

【機器學習】手寫數字識別算法

1.數據準備

2.測試算法

相關推薦