【Keras篇】---利用keras改寫VGG16經典模型在手寫數字識別體中的應用

阿新 • • 發佈：2018-03-30

model類都是 ast 訓練樣本轉化一個 h5py 次梯度窗口

一、前述

VGG16是由16層神經網絡構成的經典模型，包括多層卷積，多層全連接層，一般我們改寫的時候卷積層基本不動，全連接層從後面幾層依次向前改寫，因為先改參數較小的。

二、具體

1、因為本文中代碼需要依賴OpenCV,所以第一步先安裝OpenCV

技術分享圖片

因為VGG要求輸入244*244，而數據集是28*28的，所以需要通過OpenCV在代碼裏去改變。

2、把模型下載後離線放入用戶的管理目錄下面，這樣訓練的時候就不需要從網上再下載了

技術分享圖片

3、我們保留的是除了全連接的所有層。

4、選擇數據生成器，在真正使用的時候才會生成數據，加載到內存，前面yield只是做了一個標記

技術分享圖片

代碼：

# 使用遷移學習的思想，以VGG16作為模板搭建模型，訓練識別手寫字體 

# 引入VGG16模塊
from keras.applications.vgg16 import VGG16

# 其次加載其他模塊
from keras.layers import Input
from keras.layers import Flatten
from keras.layers import Dense
from keras.layers import Dropout
from keras.models import Model
from keras.optimizers import SGD

# 加載字體庫作為訓練樣本
from keras.datasets import 
 mnist

# 加載OpenCV（在命令行中窗口中輸入pip install opencv-python），這裏為了後期對圖像的處理，
# 大家使用pip install C:\Users\28542\Downloads\opencv_python-3.4.1+contrib-cp35-cp35m-win_amd64.whl
# 比如尺寸變化和Channel變化。這些變化是為了使圖像滿足VGG16所需要的輸入格式
import cv2
import h5py as h5py
import numpy as np

# 建立一個模型，其類型是Keras的Model類對象，我們構建的模型會將VGG16頂層（全連接層）去掉，只保留其余的網絡 

# 結構。這裏用include_top = False表明我們遷移除頂層以外的其余網絡結構到自己的模型中
# VGG模型對於輸入圖像數據要求高寬至少為48個像素點，由於硬件配置限制，我們選用48個像素點而不是原來
# VGG16所采用的224個像素點。即使這樣仍然需要24GB以上的內存，或者使用數據生成器
model_vgg = VGG16(include_top=False, weights=‘imagenet‘, input_shape=(48, 48, 3))#輸入進來的數據是48*48 3通道
#選擇imagnet,會選擇當年大賽的初始參數
#include_top=False 去掉最後3層的全連接層看源碼可知
for layer in model_vgg.layers:
    layer.trainable = False#別去調整之前的卷積層的參數
model = Flatten(name=‘flatten‘)(model_vgg.output)#去掉全連接層，前面都是卷積層
model = Dense(4096, activation=‘relu‘, name=‘fc1‘)(model)
model = Dense(4096, activation=‘relu‘, name=‘fc2‘)(model)
model = Dropout(0.5)(model)
model = Dense(10, activation=‘softmax‘)(model)#model就是最後的y
model_vgg_mnist = Model(inputs=model_vgg.input, outputs=model, name=‘vgg16‘)
#把model_vgg.input  X傳進來
#把model Y傳進來 就可以訓練模型了

# 打印模型結構，包括所需要的參數
model_vgg_mnist.summary()


#以下是原版的模型結構 224*224
model_vgg = VGG16(include_top=False, weights=‘imagenet‘, input_shape=(224, 224, 3))
for layer in model_vgg.layers:
    layer.trainable = False#別去調整之前的卷積層的參數
model = Flatten()(model_vgg.output)
model = Dense(4096, activation=‘relu‘, name=‘fc1‘)(model)
model = Dense(4096, activation=‘relu‘, name=‘fc2‘)(model)
model = Dropout(0.5)(model)
model = Dense(10, activation=‘softmax‘, name=‘prediction‘)(model)
model_vgg_mnist_pretrain = Model(model_vgg.input, model, name=‘vgg16_pretrain‘)

model_vgg_mnist_pretrain.summary()

# 新的模型不需要訓練原有卷積結構裏面的1471萬個參數，但是註意參數還是來自於最後輸出層前的兩個
# 全連接層，一共有1.2億個參數需要訓練
sgd = SGD(lr=0.05, decay=1e-5)#lr 學習率 decay 梯度的逐漸減小 每叠代一次梯度就下降 0.05*（1-（10的-5））這樣來變
#隨著越來越下降 學習率越來越小 步子越小
model_vgg_mnist.compile(loss=‘categorical_crossentropy‘,
                                 optimizer=sgd, metrics=[‘accuracy‘])

# 因為VGG16對網絡輸入層需要接受3通道的數據的要求，我們用OpenCV把圖像從32*32變成224*224，把黑白圖像轉成RGB圖像
# 並把訓練數據轉化成張量形式，供keras輸入
(X_train, y_train), (X_test, y_test) = mnist.load_data("../test_data_home")
X_train, y_train = X_train[:1000], y_train[:1000]#訓練集1000條
X_test, y_test = X_test[:100], y_test[:100]#測試集100條
X_train = [cv2.cvtColor(cv2.resize(i, (48, 48)), cv2.COLOR_GRAY2RGB)
           for i in X_train]#變成彩色的
#np.concatenate拼接到一起把
X_train = np.concatenate([arr[np.newaxis] for arr in X_train]).astype(‘float32‘)

X_test = [cv2.cvtColor(cv2.resize(i, (48, 48)), cv2.COLOR_GRAY2RGB)
          for i in X_test]
X_test = np.concatenate([arr[np.newaxis] for arr in X_test]).astype(‘float32‘)

print(X_train.shape)
print(X_test.shape)

X_train = X_train / 255
X_test = X_test / 255


def tran_y(y):
    y_ohe = np.zeros(10)
    y_ohe[y] = 1
    return y_ohe


y_train_ohe = np.array([tran_y(y_train[i]) for i in range(len(y_train))])
y_test_ohe = np.array([tran_y(y_test[i]) for i in range(len(y_test))])

model_vgg_mnist.fit(X_train, y_train_ohe, validation_data=(X_test, y_test_ohe),
                             epochs=100, batch_size=50)

結果：

技術分享圖片

自定義的網絡層：

技術分享圖片

【Keras篇】---利用keras改寫VGG16經典模型在手寫數字識別體中的應用

model類都是 ast 訓練樣本轉化一個 h5py 次梯度窗口一、前述 VGG16是由16層神經網絡構成的經典模型，包括多層卷積，多層全連接層，一般我們改寫的時候卷積層基本不動，全連接層從後面幾層依次向前改寫，因為先改參數較小的。二、具體 1、因為本文中代碼需

【深度學習】python實現簡單神經網路以及手寫數字識別案例

前言 \quad \qu

利用卷積神經網路進行手寫數字識別詳解

import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data ‘’‘可分別用這兩個函式建立卷積核(kernel)與偏置(bias)’’’ #返回一個給定形狀的變數，並自動以截斷正態分佈

【問題解決方案】Keras手寫數字識別-ConnectionResetError: [WinError 10054] 遠程主機強迫關閉了一個現有的連接

遠程主機 googl reset info 識別 .cn keras com demo 參考：臺大李宏毅老師視頻課程-Keras-Demo 在載入數據階段報錯： ConnectionResetError: [WinError 10054] 遠程主機強迫關閉了一個現有的連接

【人工智慧】利用C語言實現KNN演算法進行手寫數字識別

KNN演算法稱為鄰近演算法，或者說K最近鄰(kNN，k-NearestNeighbor)分類演算法。所謂K最近鄰，就是k個最近的鄰居的意思，說的是每個樣本都可以用它最接近的k個鄰居來代表。kNN演算法的核心思想是如果一個樣本在特徵空間中的k個最相鄰的樣本中的大多數屬於某一個類

keras入門實戰：手寫數字識別

如果 turn wid 寬度 initial 作用 err examples 預測近些年由於理論知識的硬件的快速發展，使得深度學習達到了空前的火熱。深度學習已經在很多方面都成功得到了應用，尤其是在圖像識別和分類領域，機器識別圖像的能力甚至超過了人類。本文用深度學習Pyt

【機器學習】手寫數字識別算法

alt gdi 數字識別 -1 轉換 error: erro files turn 1.數據準備樣本數據獲取忽略，實際上就是將32*32的圖片上數字格式化成一個向量，如下：本demo所有樣本數據都是基於這種格式的訓練數據：將圖片數據轉成1*1024的數組，作為一

【機器學習--opencv3.4.1版本基於Hog特徵描述子Svm對經典手寫數字識別】

方向梯度直方圖（Histogram of Oriented Gradient, HOG）特徵是一種在計算機視覺和影象處理中用來進行物體檢測的特徵描述子。HOG特徵通過計算和統計影象區域性區域的梯度方向直方圖來構成特徵。 #include <iostream> #inc

基於Keras mnist手寫數字識別---Keras卷積神經網路入門教程

目錄 1、一些說明 2、常量定義 3、工具函式 4、模型定義以及訓練 4.1、匯入庫 4.2、主入口 4.3、主函式 4.3.1、獲取訓練資料 4.3.1、定義模型 4.3.2

【AI實戰】訓練第一個AI模型：MNIST手寫數字識別模型

在上篇文章中，我們已經把AI的基礎環境搭建好了（見文章：Ubuntu + conda + tensorflow + GPU + pycharm搭建AI基礎環境），接下來將基於tensorflow訓練第一個AI模型：MNIST手寫數字識別模型。 MNIST是一個經典的手寫數字資料集，來自美國國家

【Python例項第20講】手寫數字識別問題的K-Means聚類

機器學習訓練營——機器學習愛好者的自由交流空間（qq 群號：696721295）在這個例子裡，我們在手寫數字識別資料集上，比較 K-means 聚類演算法對於不同的初始化策略對執行時間和結果質量的影響。我們也利用不同的聚類質量測度判別聚類標籤對於參考標籤的擬合優度。這裡使

【4】caffe的python介面學習：mnist例項---手寫數字識別

一、資料準備官網提供的mnist資料並不是圖片，但我們以後做的實際專案可能是圖片。因此有些人並不知道該怎麼辦。在此我將mnist資料進行了轉化，變成了一張張的圖片，我們練習就從圖片開始。下面是轉化的程式碼。 import numpy as np import struc

基於Keras：手寫數字識別

一、概述手寫數字識別通常作為第一個深度學習在計算機視覺方面應用的示例，Mnist資料集在這當中也被廣泛採用，可用於進行訓練及模型效能測試；模型的輸入： 32*32的手寫字型圖片，這些手寫字型包含0~9數字，也就是相當於10個類別的圖片模型的輸出：分類結果，0~

【機器學習 sklearn】手寫數字識別 SVM

執行結果： "D:\Program Files\Python27\python.exe" D:/PycharmProjects/sklearn/SVM.py (1797L, 64L) [[ 0. 0. 5. ..., 0. 0. 0.]

GAN-手寫數字識別-Keras

from keras.models import Sequential from keras.layers import Dense from keras.layers import Reshape from keras.layers.core import Activation from keras.

【深度學習】基於Numpy實現的神經網路進行手寫數字識別

直接先用前面設定的網路進行識別，即進行推理的過程，而先忽視學習的過程。推理的過程其實就是前向傳播的過程。深度學習也是分成兩步：學習 + 推理。學習就是訓練模型，更新引數；推理就是用學習到的引數來處理新的資料。 from keras.datasets.mnist impor

【深度學習】3：BP神經網路與MNIST資料集實現手寫數字識別

前言：這是一篇基於tensorflow框架，建立的只有一層隱藏層的BP神經網路，做的圖片識別，內容也比較簡單，全當是自己的學習筆記了。 –—-—-—-—-—-—-—-—-—-—-—-—–—-—-—-—-—-—-—-——-—-—-—-—-—-—-—-—-—-—-

【好玩的計算機視覺】KNN演算法手寫數字識別

OCR應用非常廣泛，而且有許多方法，今天用KNN演算法實現簡單的0-9手寫數字識別。本程式使用OpenCV 3.0和Python 3。 KNN演算法是K近鄰分類演算法，屬於機器學習中的監督學習，需要一定量的帶標籤的輸入樣本資料進行“訓練”，然後就可以識別。我給“訓練”打引

MNIST手寫數字識別【Matlab神經網路工具箱】

MNIST手寫數字識別Matlab程式碼：%Neural Networks Codes will be run on this part tic %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

Keras入門之一： Hello Keras on MNIST 第一個例子-手寫數字識別

先花一分鐘介紹一下KerasKeras的好處很多人已經說過，純Python寫成的，而且支援CPU/GPU的切換，能方便的使用 CNN/RNN 搞你想要的東東。下圖是Keras的功能模組結構圖，十分清晰。下面我們看一下我學習的第一個Keras 用於建立網路的學習例子。這是採用了

【Keras篇】---利用keras改寫VGG16經典模型在手寫數字識別體中的應用

相關推薦