深度學習之PyTorch —— CNN實現MNIST手寫數字分類

阿新 • • 發佈：2018-12-20

#　運用ＣＮＮ分析ＭＮＩＳＴ手寫數字分類

import torch 
import numpy as np
from torch.utils.data import DataLoader
from torchvision.datasets import mnist
from torch import  nn
from torch.autograd import Variable
from torch import  optim
from torchvision import transforms

# 定義CNN
class CNN(nn.Module):
    def __init__(self):
        super(CNN,self).__init__()
        
        self.layer1 = nn.Sequential(
                nn.Conv2d(1,16,kernel_size=3), # 16, 26 ,26
                nn.BatchNorm2d(16),
                nn.ReLU(inplace=True))
        
        self.layer2 = nn.Sequential(
                nn.Conv2d(16,32,kernel_size=3),# 32, 24, 24
                nn.BatchNorm2d(32),
                nn.ReLU(inplace=True),
                nn.MaxPool2d(kernel_size=2,stride=2)) # 32, 12,12     (24-2) /2 +1
        
        self.layer3 = nn.Sequential(
                nn.Conv2d(32,64,kernel_size=3), # 64,10,10
                nn.BatchNorm2d(64),
                nn.ReLU(inplace=True))
        
        self.layer4 = nn.Sequential(
                nn.Conv2d(64,128,kernel_size=3),  # 128,8,8
                nn.BatchNorm2d(128),
                nn.ReLU(inplace=True),
                nn.MaxPool2d(kernel_size=2,stride=2))  # 128, 4,4
        
        self.fc = nn.Sequential(
                nn.Linear(128 * 4 * 4,1024),
                nn.ReLU(inplace=True),
                nn.Linear(1024,128),
                nn.ReLU(inplace=True),
                nn.Linear(128,10))
        
    def forward(self,x):
        x = self.layer1(x)
        x = self.layer2(x)
        x = self.layer3(x)
        x = self.layer4(x)
        x = x.view(x.size(0),-1)
        x = self.fc(x)
        
        return x


# 使用內建函式下載mnist資料集
train_set = mnist.MNIST('./data',train=True)
test_set = mnist.MNIST('./data',train=False)

# 預處理=>將各種預處理組合在一起
data_tf = transforms.Compose(
                [transforms.ToTensor(),
                 transforms.Normalize([0.5],[0.5])])

train_set = mnist.MNIST('./data',train=True,transform=data_tf,download=True)
test_set = mnist.MNIST('./data',train=False,transform=data_tf,download=True)

train_data = DataLoader(train_set,batch_size=64,shuffle=True)
test_data = DataLoader(test_set,batch_size=128,shuffle=False)

net = CNN()
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(),1e-1)

nums_epoch = 20

# 開始訓練
losses =[]
acces = []
eval_losses = []
eval_acces = []

for epoch in range(nums_epoch):
    train_loss = 0
    train_acc = 0
    net = net.train()
    for img , label in train_data:
        #img = img.reshape(img.size(0),-1) 
        img = Variable(img)
        label = Variable(label)
        
        # 前向傳播
        out = net(img)
        loss = criterion(out,label)
        # 反向傳播
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        
        # 記錄誤差
        train_loss += loss.item()
        # 計算分類的準確率
        _,pred = out.max(1)
        num_correct = (pred == label).sum().item()
        acc = num_correct / img.shape[0]
       
        train_acc += acc
        
    losses.append(train_loss / len(train_data))
    acces.append(train_acc / len(train_data))
    
    eval_loss = 0
    eval_acc = 0
    # 測試集不訓練
    for img , label in test_data:
        #img = img.reshape(img.size(0),-1)
        img = Variable(img)
        label = Variable(label)
        
        out = net(img)
        
        loss = criterion(out,label)
        
        # 記錄誤差
        eval_loss += loss.item()
        
        _ , pred = out.max(1)
        num_correct = (pred==label).sum().item()
        acc = num_correct / img.shape[0]
        
        eval_acc += acc
    eval_losses.append(eval_loss / len(test_data))
    eval_acces.append(eval_acc / len(test_data))
    
    print('Epoch {} Train Loss {} Train  Accuracy {} Teat Loss {} Test Accuracy {}'.format(
        epoch+1, train_loss / len(train_data),train_acc / len(train_data), eval_loss / len(test_data), eval_acc / len(test_data)))

輸出：

Epoch 1 Train Loss 0.14103838276348388 Train  Accuracy 0.9574893390191898 Teat Loss 0.03636252877738657 Test Accuracy 0.9888251582278481
Epoch 2 Train Loss 0.03642434606165774 Train  Accuracy 0.9888059701492538 Teat Loss 0.0744408220288497 Test Accuracy 0.9761669303797469
Epoch 3 Train Loss 0.025223525594483053 Train  Accuracy 0.9920542377398721 Teat Loss 0.02412710657131068 Test Accuracy 0.9920886075949367
Epoch 4 Train Loss 0.020014993536637535 Train  Accuracy 0.9937533315565032 Teat Loss 0.022930343906524816 Test Accuracy 0.9923852848101266
Epoch 5 Train Loss 0.015570432650668027 Train  Accuracy 0.9948694029850746 Teat Loss 0.019973596770174896 Test Accuracy 0.992879746835443
Epoch 6 Train Loss 0.011754893727584688 Train  Accuracy 0.99605210554371 Teat Loss 0.01934802131373671 Test Accuracy 0.9936708860759493

因個人用CPU運算速度問題，這次僅訓練六次。相比上篇部落格，比只簡單用全連線神經網路準確率要高，達到99%。

有什麼問題歡迎評論。

深度學習之PyTorch —— CNN實現MNIST手寫數字分類

#　運用ＣＮＮ分析ＭＮＩＳＴ手寫數字分類 import torch import numpy as np from torch.utils.data import DataLoader from torchvision.datasets import mnist fro

CNN實現MNIST手寫數字識別

關鍵詞：CNN、TensorFlow、卷積、池化、特徵圖一. 前言本文用TensorFlow實現了CNN(卷積神經網路)的經典結構LeNet-5, 具體CNN的LeNet-5模型原理見《深度學習（四）卷積神經網路入門學習(1)》，講得還是比較清楚的。

使用LeNet-5實現mnist手寫數字分類識別 TensorFlow

TensorFlow的學習材料很多，但很少有講得特別詳細，讓小白一看就懂的。我自己總結了cnn實現mnist分類識別的方法，希望能給TensorFlow初學者一些幫助，實測在python3下可以執行。 # -*- coding: utf-8 -*- # 使用LeNet-5實

使用LSTM實現mnist手寫數字分類識別 TensorFlow

RNN做影象識別原理：MNIST資料集中一張圖片資料包含28*28的畫素點。RNN是將一張圖片資料的一行作為一個向量總體輸入一個X中。也就是說，RNN有28個輸入X，一個輸入X有28個畫素點。輸出最後一個結果做為預測值。 TensorFlow入門學習程式碼： # -

深度學習系列——AlxeNet實現MNIST手寫數字體識別

本文實現AlexNet,用於識別MNIST手寫數字體。所有程式碼的框架基於tensorflow。看了幾篇論文的原始碼之後，覺得tensorflow 確實很難，學習程式設計還是靠實踐。這篇部落格留著給自己以及學習深度學習道路上的小夥伴們一些參考吧，希望能對大家有所幫助！

深度學習入門——利用卷積神經網路實現MNIST手寫數字識別

MNIST（Modified National Institute of Standards and Technology）資料庫是一個大型手寫數字資料庫，通常用於訓練各種影象處理系統。該資料庫還廣泛用於機器學習領域的培訓和測試。它是通過重新打亂來自NIST原始資料集的樣本而

OpenCV機器學習：SVM分類器實現MNIST手寫數字識別

0. 開發環境最近機器學習隨著AI人工智慧的興起越來越火，博主想找一些ML的庫來練手。突然想起之前在看Opencv的doc時發現有ML的component，於是心血來潮就開始寫程式碼試試。話不多說，直接進正題。以下我的開發環境配置： -Windows7

PyTorch基礎入門六：PyTorch搭建卷積神經網路實現MNIST手寫數字識別

1）卷積神經網路(CNN)簡介關於什麼是卷積神經網路(CNN)，請自行查閱資料進行學習。如果是初學者，這裡推薦一下臺灣的李巨集毅的深度學習課程。連結就不給了，這些資料網站上隨處可見。值得一提的是，CNN雖然在影象處理的領域具有不可阻擋的勢頭，但是它絕對不僅僅只能用來影

基於PyTorch的LSTM長短時記憶網路實現MNIST手寫數字

本篇部落格主要介紹在PyTorch框架下，基於LSTM實現手寫數字的識別。在介紹LSTM長短時記憶網路之前，我先介紹一下RNN(recurrent neural network)迴圈神經網路.RNN是一種用來處理序列資料的神經網路，序列資料包括我們說話的語音、一段文字等等。它

Tensorflow深度學習筆記（二）--BPNN手寫數字識別視覺化

資料集：MNIST 啟用函式：Relu 損失函式：交叉熵 Optimizer：AdamOptimizer 視覺化工具：tensorboad 迭代21epoch，accuracy結果如下： Iter 16,Testing Accuracy:

神經網路實現Mnist手寫數字識別筆記

目錄 1.Mnist手寫數字識別介紹 Mnist手寫數字識別是Kaggle上一個很經典的機器學習資料集，裡邊包括55000張訓練資料和10000張圖片的測試資料，每張圖片大小為28*28畫素的單通圖片。該任務為通過機器學習來識別圖片中的

Tensorflow案例5：CNN演算法-Mnist手寫數字識別

學習目標目標應用tf.nn.conv2d實現卷積計算應用tf.nn.relu實現啟用函式計算應用tf.nn.max_pool實現池化層的計算應用卷積神經網路實現影象分類識別應用

機器學習之使用 scikit-learn 識別手寫數字

機器學習案例分析一：識別手寫數字： scikit-learn 提供了一些標準資料集，例如用於分類的 iris 和 digits 資料集和波士頓房價迴歸資料集 . 在下文中，我們從我們的 shell 啟動一個 Python 直譯器IDLE，

Keras下實現mnist手寫數字

之前一直在用tensorflow，被同學推薦來用keras了，把之前文件中的mnist手寫數字資料集拿來練手，程式碼如下。import struct import numpy as np import os import keras from keras.models im

北大人工智慧網課攻略[2]:mnist手寫數字分類，並測試自己的手寫體

個人程式如下：連結: https://pan.baidu.com/s/1Yy0Dg9AOGntDIdb4VGle4A 提取碼: zwv4 北大人工智慧網課考試一是手寫數字體識別，與常見的入門題目唯一的區別是我們需要再讀入老師手寫的圖片進行識別。編寫一下讀取普通圖片的程式帶入

Keras入門實戰（1）：MNIST手寫數字分類

前面的部落格中已經介紹瞭如何在Ubuntu下安裝Keras深度學習框架。現在我們使用 Keras 庫來學習手寫數字分類。我們這裡要解決的問題是：將手寫數字的灰度影象（28 畫素×28 畫素）劃分到 10 個類別中（0~9）。我們將使用 MNIST 資料集，它是機器學

深度學習之PyTorch實戰（3）——實戰手寫數字識別

　　上一節，我們已經學會了基於PyTorch深度學習框架高效，快捷的搭建一個神經網路，並對模型進行訓練和對引數進行優化的方法，接下來讓我們牛刀小試，基於PyTorch框架使用神經網路來解決一個關於手寫數字識別的計算機視覺問題，評價我們搭建的模型的標準是它是否能準確的對手寫數字圖片進行識別。　　

深度學習：tensorflow入門：卷積神經網路實現MNIST手寫字型識別

程式碼中./data/mnist/input_data/為真實MNIST資料集的路徑 import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data # 定義

GAN學習總結三-Pytorch實現利用GAN進行MNIST手寫數字生成

GAN學習總結三-Pytorch實現利用GAN進行MNIST手寫數字生成前面兩篇部落格分別介紹了GAN的基本概念和理論推導，理論聯絡實際，本節從程式碼的角度理解GAN網路的實現及相關細節,加深自己的理解. 整個實現過程如下: 匯入相關庫 import torch

Tensorflow 實戰Google深度學習框架——學習筆記（六）LeNet-5網路實現MNIST手寫數字集識別

使用LeNet-5模型實現MNIST手寫數字識別，其神經網路架構如下：一、詳細介紹LeNet-5模型每一層的結構第一層，卷積層這一層輸入原始的影象畫素，接受的輸入層大小為32*32*1，第一個卷積層過濾器尺寸為5*5,共6個，不使用全0填

深度學習之PyTorch —— CNN實現MNIST手寫數字分類

相關推薦