用cnn構建多層神經網絡來識別mnist中的圖片

阿新 • • 發佈：2017-10-28

argv padding out load 神經網絡 dir sco ack import

mnist.py

import tensorflow as tf
import numpy as np
import argparse
import sys
import urllib
import os
import gzip

SOURCE_URL = r‘http://yann.lecun.com/exdb/mnist/‘
TRAIN_SIZE = 55000
TEST_SIZE = 10000
VALIDATE_SIZE = 5000
IMAGE_SIZE = 28
NUMBER_CHANNEL = 1
TRAIN_DATA = ‘train-images-idx3-ubyte.gz‘
TRAIN_LABELS  
= ‘train-labels-idx1-ubyte.gz‘
TEST_DATA = ‘t10k-images-idx3-ubyte.gz‘
TEST_LABELS = ‘t10k-labels-idx1-ubyte.gz‘


class Mnist:
  def __init__(self, FLAGS):
    self.FLAGS = FLAGS
    self.start = 0
    self.train_size = TRAIN_SIZE
    self.validate_size = VALIDATE_SIZE
    self.test_size = TEST_SIZE
    
    self._maybe_download(TRAIN_DATA)
    self.train_data  
= self._extract_images(TRAIN_DATA)
    
    self.validate_data, self.train_data = self._get_validate_data(self.train_data, self.validate_size)

    self._maybe_download(TRAIN_LABELS)
    self.train_labels = self._extract_labels(TRAIN_LABELS)
    self.train_labels = self._one_hot(self.train_labels)
    
    self.validate_labels, self.train_labels 
= self._get_validate_data(self.train_labels, self.validate_size)
    
    self._maybe_download(TEST_DATA)
    self.test_data = self._extract_images(TEST_DATA)
    
    self._maybe_download(TEST_LABELS)
    self.test_labels = self._extract_labels(TEST_LABELS)
    self.test_labels = self._one_hot(self.test_labels)
    
    if self.num_images != self.num_labels:
      raise Error(‘number of images and number of labels don\‘t match‘)
    
    self.train_data, self.train_labels = self._shuffle(self.train_data, self.train_labels) 
    print(‘Done preparing data‘)

  def _shuffle(self, images, labels):
    perm = np.arange(self.train_size)
    np.random.shuffle(perm)
    return images[perm], labels[perm] 
    
  def _read32(self, bufstream):
    dt = np.dtype(‘>i4‘)
    buf = bufstream.read(4)
    data = np.frombuffer(buf, dtype = dt)[0]
    data.astype(np.int32)
    return data
    
  def _maybe_download(self, filename):
    filepath = os.path.join(self.FLAGS.data_dir, filename)
    if not os.path.isdir(self.FLAGS.data_dir):
      os.path.mkdir(self.FLAGS.data_dir)
    if not os.path.isfile(filepath):
        #def _progress():           
      urllib.request.urlopen(SOURCE_URL, filepath)
        
  def _extract_images(self, filename):
    filepath = os.path.join(self.FLAGS.data_dir, filename)
    with gzip.open(filepath) as bufstream:
      magic = self._read32(bufstream)
      print(magic)
      if not magic == 2051:
        raise ValueError("2051 error")
      num_data = self._read32(bufstream)
      self.num_images = num_data
      rows = self._read32(bufstream)
      self.image_size = rows
      cols = self._read32(bufstream)
      print(‘num_data %d rows %d cols %d‘% (num_data, rows, cols))
      buf = bufstream.read(num_data*rows*cols*NUMBER_CHANNEL) 
      data = np.frombuffer(buf, dtype = np.uint8)
      data.astype(np.float32)
      data = data.reshape(num_data, rows*cols*NUMBER_CHANNEL)     
      return data

  def _extract_labels(self, filename):
    filepath = os.path.join(self.FLAGS.data_dir, filename)
    with gzip.open(filepath) as bufstream: 
      magic = self._read32(bufstream)
      if magic != 2049:
        raise ValueError(‘2049 error‘)
      num_labels = self._read32(bufstream)
      self.num_labels = num_labels
      print(‘num_labels %d‘%num_labels)
      buf = bufstream.read(num_labels*1)
      labels = np.frombuffer(buf, dtype = np.uint8)
      labels.astype(np.int32)       
      return labels
        
  def _get_validate_data(self, data, validate_size):
    if validate_size > data.shape[0]:
      raise Error(‘validate size out of bound‘)
    validate_data = data[:validate_size,...]
    data_left = data[validate_size:,...]
    return validate_data, data_left 
    
  def _one_hot(self, labels):
    num_labels = labels.shape[0]
    one_hot_labels = np.zeros([num_labels,10],dtype = np.float32)    
    one_hot_labels[[range(num_labels)], labels] = 1.0
    return one_hot_labels

  def get_batch(self, batch_size):              
    end = self.start +batch_size
    tmp_start = self.start
   
    if end >= self.train_size:
      self.start = end%self.train_size
      tmp_data = np.vstack((self.train_data, self.train_data[:batch_size,...]))
      tmp_labels = np.vstack((self.train_labels, self.train_labels[:batch_size,...]))
      return tmp_data[tmp_start:end,...],tmp_labels[tmp_start:end,...]
    else:
      self.start = end
      return self.train_data[tmp_start:end,...], self.train_labels[tmp_start:end,...]

mnist_cnn.py

import tensorflow as tf
import numpy as np
import mnist
import argparse
import sys 
import os
from tensorflow.examples.tutorials.mnist import input_data

FLAGS = tf.flags.FLAGS

def _weight(name, shape):
  return tf.Variable(tf.truncated_normal(stddev = 0.1, shape = shape, name = name, dtype = tf.float32))

def _bias(name, shape):
  return tf.Variable(tf.constant(0.1, shape = shape, name = name, dtype= tf.float32))   

def _conv(x, w):
  return tf.nn.conv2d(x, w, strides = [1,1,1,1], padding= ‘SAME‘)
  
def _max_pool(x):
  return tf.nn.max_pool(x, ksize = [1,2,2,1], strides = [1,2,2,1], padding = ‘SAME‘)

def _rm_prefiles(paths):
  for path in paths:
    for root, dirs, names in os.walk(path):
      for filename in names:
        os.remove(os.path.join(root, filename))
      

def cnn_structure(x):
  x_images =tf.reshape(x,[-1,28,28,1])
  
  with tf.name_scope(‘conv1‘):
    w_cov1 = _weight(‘w_cov1‘, [5,5,1,32])
    with tf.name_scope(‘w_cov1‘):
      tf.summary.scalar(‘w_cov1_mean‘, tf.reduce_mean(w_cov1))
      tf.summary.scalar(‘w_cov1_dev‘, tf.reduce_mean(tf.square(w_cov1- tf.reduce_mean(w_cov1))))
      tf.summary.histogram(‘w_cov1_hist‘, w_cov1)
    b_cov1 = _bias(‘b_cov1‘, [32])
    h_cov1 = tf.nn.relu(_conv(x_images, w_cov1) + b_cov1 )
    
  h_pool1 = _max_pool(h_cov1)
    
  with tf.name_scope(‘conv2‘):
    w_cov2 = _weight(‘w_cov2‘, [5,5,32,64])
    b_cov2 = _bias(‘b_cov2‘, [64]) 
    h_cov2 = tf.nn.relu(_conv(h_pool1, w_cov2) + b_cov2)
    
  h_pool2 = _max_pool(h_cov2)
  h_pool2_flat = tf.reshape(h_pool2, [-1, 3136])
  
  with tf.name_scope(‘fc1‘):
    w_fc1 = _weight(‘w_fc1‘, [7*7*64, 1024])
    b_fc1 = _bias(‘b_fc1‘, [1024])
    h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, w_fc1) + b_fc1)
  
  with tf.name_scope(‘dropout‘):
    keep_prob = tf.placeholder(dtype = tf.float32)
    h_dropout = tf.nn.dropout(h_fc1, keep_prob)
  
  with tf.name_scope(‘fc2‘):
    w_fc2 = _weight(‘w_fc2‘, [1024, 10])
    b_fc2 = _bias(‘b_fc2‘, [10])
    y = tf.matmul(h_dropout, w_fc2) + b_fc2
  
  saver = tf.train.Saver({‘w_cov1‘:w_cov1, ‘b_cov1‘:b_cov1, ‘w_cov2‘:w_cov2, ‘b_cov2‘:b_cov2})
  
  return y, keep_prob, saver
  
def main(_):
 
  mnistdata = input_data.read_data_sets(FLAGS.data_dir, one_hot=True)
  mymnist = mnist.Mnist(FLAGS)
  x = tf.placeholder(shape = [None, 784], dtype = tf.float32)
  y_ = tf.placeholder(shape = [None, 10], dtype = tf.float32)
  
  y, keep_prob, saver = cnn_structure(x)
  
  with tf.name_scope(‘train_section‘):  
    with tf.name_scope(‘Cross_entropy‘):
      cross_entropy = tf.reduce_sum(tf.nn.softmax_cross_entropy_with_logits(logits = y, labels = y_))
      tf.summary.scalar(‘cross_entropy‘, cross_entropy)

    with tf.name_scope(‘Adam_Optimizer‘): 
      optimizer = tf.train.AdamOptimizer(learning_rate = 0.0001)  
      train_steps = optimizer.minimize(cross_entropy)
  
  with tf.name_scope(‘Test_section‘):
    with tf.name_scope(‘Accuracy‘):
      prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1))  
      accuracy = tf.reduce_mean(tf.cast(prediction, tf.float32))
    
    
  merged = tf.summary.merge_all()
  
  
  _rm_prefiles([FLAGS.summary_dir, FLAGS.model_dir])
  
  with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    train_writer = tf.summary.FileWriter(FLAGS.summary_dir, sess.graph)
  
  
    for i in range(FLAGS.train_steps):
      if i%20 ==0:
        j = int(i/int(FLAGS.train_steps/60))
        sys.stdout.write(‘\r%4.2f%% ‘%(float(i)/float(FLAGS.train_steps)*100))
        sys.stdout.write(‘->‘+‘#‘*j+(60-j)*‘ ‘+‘<-‘)
        sys.stdout.flush()
      #batch = mnistdata.train.next_batch(50)
      #feed_dict = {x:batch[0], y_:batch[1],keep_prob:0.5}
      batch_xs, batch_ys = mymnist.get_batch(FLAGS.batch_size)
      feed_dict = {x: batch_xs, y_: batch_ys, keep_prob: 0.5}
      
      _, summaries = sess.run([train_steps,merged], feed_dict = feed_dict)
      train_writer.add_summary(summaries, i)
      ‘‘‘
      if i%100 ==0:
        feed_dict= {x:mymnist.test_data, y_:mymnist.test_labels, keep_prob : 1.0}
        #feed_dict = {x: mnistdata.test.images, y_: mnistdata.test.labels, keep_prob: 1.0} 
        print(‘%5.2f%%‘%(sess.run(accuracy,feed_dict = feed_dict)*100))
      ‘‘‘
    saver.save(sess, os.path.join(FLAGS.model_dir, ‘model.ckpt‘))
    feed_dict= {x:mymnist.test_data, y_:mymnist.test_labels, keep_prob : 1.0}
    #feed_dict = {x: mnistdata.test.images, y_: mnistdata.test.labels, keep_prob: 1.0}  
    print(‘%5.2f%%‘%(sess.run(accuracy,feed_dict = feed_dict)*100))
    
  



if __name__ ==‘__main__‘:
    parser = argparse.ArgumentParser()
    parser.add_argument("-d", "--data_dir", type = str, default = r‘W:\workspace\tensorflow\my\data‘,
    help = "Directory for storing input data")
    parser.add_argument(‘-m‘, "--model_dir", type = str, default = r‘W:\workspace\tensorflow\mnistexpert\model‘, help = ‘Directory for storing model‘)
    parser.add_argument(‘-s‘,‘--summary_dir‘, type = str, default = r‘W:\workspace\tensorflow\mnistexpert\summary‘, help = ‘Directory for storing summary data‘)
    parser.add_argument(‘-b‘, ‘--batch_size‘, type = int, default = 50, help = ‘Size of batch‘)
    parser.add_argument(‘-t‘, ‘--train_steps‘, type = int, default = 20000, help = ‘Number of steps to train the model‘)
    FLAGS, unparsed = parser.parse_known_args()
    tf.app.run(main = main, argv = [sys.argv[0]]+ unparsed)

在這次實現中將深度神經網絡框架獨立了出來寫進了一個函數，從而使得代碼可讀性大大提高

用cnn構建多層神經網絡來識別mnist中的圖片

argv padding out load 神經網絡 dir sco ack import mnist.py import tensorflow as tf import numpy as np import argparse import sys import urll

Spark2.0機器學習系列之7： MLPC（多層神經網絡）

element nbsp hid 隨機梯度下降 support file dict 分類器希望 Spark2.0 MLPC（多層神經網絡分類器）算法概述 MultilayerPerceptronClassifier（MLPC）這是一個基於前饋神經網絡的分類器，它是一種在

MXNET：多層神經網絡

pri 批量 ali end ear 多層權重 clas 方法多層感知機（multilayer perceptron，簡稱MLP）是最基礎的深度學習模型。多層感知機在單層神經網絡的基礎上引入了一到多個隱藏層（hidden layer）。隱藏層位於輸入層和輸出層之間。隱

用Helm3構建多層微服務

Helm是一款非常流行的k8s包管理工具。以前就一直想用它，但看到它產生的檔案比k8s要複雜許多，就一直猶豫，不知道它的好處能不能抵消掉它的複雜度。但如果不用，而是用Kubectl來進行調式真的很麻煩。正好最近Helm3正式版出來了，比原來的Helm2簡單了不少，就決定還是試用一下。結果證明確實很複雜，它的好

構建多層感知器神經網路對數字圖片進行文字識別

在Keras環境下構建多層感知器模型，對數字影象進行精確識別。模型不消耗大量計算資源，使用了cpu版本的keras，以Tensorflow 作為backended，在ipython互動環境jupyter notebook中進行編寫。 1.資料來源此資料庫包含四部分：訓練資

用tensorflow構建兩層簡單神經網絡（全連接）

atm 傳播輸入 txt 人工智 ESS var etx 構建中國大學Mooc 北京大學人工智能實踐：Tensorflow筆記(week3) #coding:utf-8 #兩層簡單神經網絡（全連接） import tensorflow as tf #定義輸入和參

實現一個單隱層神經網絡

深度學習 scalar 線性 cos arguments some calculate desc shape 　　看過首席科學家NG的深度學習公開課很久了，一直沒有時間做神經網絡編程題，做完想把思路總結下來，僅僅記錄神經網絡編程主線。一引用工具包 imp

CS231n 作業1 SVM+softmax+兩層神經網絡

clas 天都 dao mar ref har svm .com 成了大概用了有小半個月的時間斷斷續續的完成了作業1，因為期間每天都還在讀論文，所以進度有些落後，不過做完感覺也是收獲頗豐。附上地址 http://note.youdao.com/noteshare?id=

python構建bp單層神經網絡__1.可視化數據

ron read highlight sca python otl 等我應該 ID 1.將數據寫入csv文件，應該可以python代碼直接實現數據集的寫入，但我對文件讀取這塊不太熟練，等我成功了再加上，這裏我直接手寫將數據集寫入Excel 2.然後把後綴改成.csv

tensorflow構建一個簡單神經網絡

優化方法 clas show CA noise urn sil ini hold 使用Tensorflow實現一個簡單的神經網絡輸入數據：輸入數據的形狀是[300, 1]，也就是每個元素有一個特征，所以輸入神經元是一個。隱藏層：輸出神經元10個。輸出數據會成

識別貓的單隱藏層神經網絡（我的第一個模型）

負數所有 sha 分類 col 缺少 right shadow 一個摘要：算法詳解；代碼；可視化查看超參數影響目標：識別一張圖是不是貓數據集：訓練數據209張64*64 測試數據50張 64*64 方案：二分分類法算法：logistic回歸，

對比學習用 Keras 搭建 CNN RNN 等常用神經網絡

rand tar util 回歸 flatten else package ini 濾波 Keras 是一個兼容 Theano 和 Tensorflow 的神經網絡高級包, 用他來組件一個神經網絡更加快速, 幾條語句就搞定了. 而且廣泛的兼容性能使 Keras 在 Wind

用pytorch實現多層感知機（MLP)（全連線神經網路FC）分類MNIST手寫數字體的識別

1.匯入必備的包 1 import torch 2 import numpy as np 3 from torchvision.datasets import mnist 4 from torch import nn 5 from torch.autograd import Variable 6

淺層神經網絡

slide print sig bsp alt upd ive ret respond 1、神經網絡概述： dW[L]=（1/m)*dZ[L]A[L-1].T db[L]=(1/m)*np.sum(dZ[L],axis=1,keepdims=True) dZ[L-1]=

tf.contrib.rnn.static_bidirectional_rnn和MultiRNNCell構建多層靜態雙向LSTM

import tensorflow as tf import numpy as np # 設定訓練引數 learning_rate = 0.01 max_examples = 40 batch_size = 128 display_step = 10 # 每間隔10次訓練

用tensorflow構建兩層簡單神經網路（全連線）

中國大學Mooc 北京大學人工智慧實踐：Tensorflow筆記(week3) #coding:utf-8 #兩層簡單神經網路（全連線） import tensorflow as tf #定義輸入和引數 #用placeholder實現輸入定義（sess.run中喂一組資料） x = tf.pl

用VS新建多層架構時引用第三方dll 時清理解決方案時，放bin資料夾下的bll被清空問題

今天新建一個新的專案時，引用了多個第三方的dll，每次一清空解決方案重新生成，dll就被清空，導致專案報錯，整個解決方案的dll都沒生成，so 看起來很嚴重。後來搜了下，說第三方的dll檔案不能放bin 檔案中，新建一個資料夾用來存放dll,檔案。另外也注意下引

跟著吳恩達學深度學習：用Scala實現神經網路-第二課：用Scala實現多層神經網路

上一章我們講了如何使用Scala實現LogisticRegression，這一張跟隨著吳恩達的腳步我們用Scala實現基礎的深度神經網路。順便再提一下，吳恩達對於深度神經網路的解釋是我如今聽過的最清楚的課，感嘆一句果然越是大牛知識解釋得越清晰明瞭。本文分為以下四個部分。

MLCC筆記16 - 多類別神經網絡 (Multi-Class Neural Networks)

神經網絡 margin -type 關鍵詞 cati p s 想法表示 works 原文鏈接：https://developers.google.com/machine-learning/crash-course/multi-class-neural-networks/

深度學習筆記（三）用Torch實現多層感知器

上一次我們使用了輸出節點和輸入節點直接相連的網路。網路裡只有兩個可變引數。這種網路只能表示一條直線，不能適應複雜的曲線。我們將把它改造為一個多層網路。一個輸入節點，然後是兩個隱藏層，每個隱藏層有3個節點，每個隱藏節點後面都跟一個非線性的Sigmoid函式。如圖所示，這次

用cnn構建多層神經網絡來識別mnist中的圖片

相關推薦