用keras作CNN卷積網絡書本分類（書本、非書本）

阿新 • • 發佈：2017-12-31

div 問題：標簽 turn 生成 ring module 數據質量讀取

本文介紹如何使用keras作圖片分類（2分類與多分類，其實就一個參數的區別。。。呵呵）

先來看看解決的問題：從一堆圖片中分出是不是書本，也就是最終給圖片標簽上：“書本“、“非書本”，簡單吧。

先來看看網絡模型，用到了卷積和全連接層，最後套上SOFTMAX算出各自概率，輸出ONE-HOT碼，主要部件就是這些，下面的nb_classes就是用來控制分類數的，本文是2分類：

from keras.models import Sequential  
from keras.layers.core import Dense, Dropout, Activation, Flatten  
from keras.layers.convolutional import Convolution2D, MaxPooling2D  
from keras.optimizers import SGD  


def Net_model(nb_classes, lr=0.001,decay=1e-6,momentum=0.9):  
    model = Sequential()  
    model.add(Convolution2D(filters=10, kernel_size=(5,5),
                            padding=‘valid‘,  
                            input_shape=(200, 200, 3) 
))  
    model.add(Activation(‘tanh‘))  
    model.add(MaxPooling2D(pool_size=(2, 2)))  
  
    model.add(Convolution2D(filters=20, kernel_size=(10,10)))
    model.add(Activation(‘tanh‘))  
    model.add(MaxPooling2D(pool_size=(2, 2)))  
    model.add(Dropout(0.25))  
  
    model.add(Flatten())  
    model.add(Dense(1000))
    model.add(Activation(‘tanh‘))  
    model.add(Dropout(0.5))  
    model.add(Dense(nb_classes))  
    model.add(Activation(‘softmax‘))  
  
    sgd = SGD(lr=lr, decay=decay, momentum=momentum, nesterov=True)  
    model.compile(loss=‘categorical_crossentropy‘, optimizer=sgd)  
      
    return model

上面的input_shape=(200, 200, 3)代表圖片像素大小為寬高為200，200，並且包含RGB 3通道的圖片，不是灰度圖片（只要1個通道）

也就是說送入此網絡的圖片寬高必須200*200*3；如果不是這個shape就需要resize到這個shape

下面來看看訓練程序，首先肯定是要收集些照片，書本、非書本的照片，我是分別放在了0文件夾和1文件夾下了，再帶個驗證用途的文件夾validate：

技術分享圖片　　

訓練程序涉及到幾個地方：照片文件的讀取、模型加載訓練與保存、可視化訓練過程中的損失函數value

照片文件的讀取

import cv2
import os
import numpy as np
import keras

def loadImages():
    imageList=[]
    labelList=[]

    rootdir="d:\\books\\0"
    list =os.listdir(rootdir)
    for item in list:
        path=os.path.join(rootdir,item)
        if(os.path.isfile(path)):
            f=cv2.imread(path)
            f=cv2.resize(f, (200, 200))#resize到網絡input的shape 

            imageList.append(f)
            labelList.append(0)#類別0

    rootdir="d:\\books\\1"
    list =os.listdir(rootdir)
    for item in list:
        path=os.path.join(rootdir,item)
        if(os.path.isfile(path)):
            f=cv2.imread(path)
            f=cv2.resize(f, (200, 200))#resize到網絡input的shape
            imageList.append(f)
            labelList.append(1)#類別1

    return np.asarray(imageList), keras.utils.to_categorical(labelList, 2)

關於（200，200）這個shape怎麽得來的，只是幾月前開始玩opencv時隨便寫了個數值，後來想利用那些圖片，就適應到這個shape了

keras.utils.to_categorical函數類似numpy.onehot、tf.one_hot這些，只是one hot的keras封裝

模型加載訓練與保存

nb_classes = 2  
nb_epoch = 30
nb_step = 6
batch_size = 3

x,y=loadImages()

from keras.preprocessing.image import ImageDataGenerator
dataGenerator=ImageDataGenerator()
dataGenerator.fit(x)
data_generator=dataGenerator.flow(x, y, batch_size, True)#generator函數，用來生成批處理數據（從loadImages中）

model=NetModule.Net_model(nb_classes=nb_classes, lr=0.0001) #加載網絡模型

history=model.fit_generator(data_generator, epochs=nb_epoch, steps_per_epoch=nb_step, shuffle=True)#訓練網絡，並且返回每次epoch的損失value

model.save_weights(‘D:\\Documents\\Visual Studio 2017\\Projects\\ConsoleApp9\\PythonApplication1\\書本識別\\trained_model_weights.h5‘)#保存權重
print("DONE, model saved in path-->D:\\Documents\\Visual Studio 2017\\Projects\\ConsoleApp9\\PythonApplication1\\書本識別\\trained_model_weights.h5")

ImageDataGenerator構造函數有很多參數，主要用來提升數據質量，比如要不要標準化數字

lr=0.001這個參數要看經驗，大了會導致不收斂，訓練的時候經常由於這個參數的問題導致重復訓練，這在沒有GPU的情況下很是痛苦。。痛苦。。。痛苦。。。

model.save_weights是保存權重，但是不保存網絡模型，對應的是model.load_weights方法

model.save是保存網絡+權重，只是。。。。此例中用save_weights保存的h5文件是125M，但用save方法保存後，h5文件就增大為280M了。。。

上面2個save方法都能finetune，只是靈活度不一樣。

可視化訓練過程中的損失函數value

import matplotlib.pyplot as plt

plt.plot(history.history[‘loss‘])
plt.show()

技術分享圖片　　

貌似沒啥好補充的。。。

AND。。。。看看預測部分吧，這部分加載圖片、加載模型，似乎都和訓練部分雷同：

def loadImages():
    imageList=[]

    rootdir="d:\\books\\validate"
    list =os.listdir(rootdir)
    for item in list:
        path=os.path.join(rootdir,item)
        if(os.path.isfile(path)):
            f=cv2.imread(path)
            f=cv2.resize(f, (200, 200))
            imageList.append(f)

    return np.asarray(imageList)

x=loadImages()


x=np.asarray(x)

model=NetModule.Net_model(nb_classes=2, lr=0.0001)
model.load_weights(‘D:\\Documents\\Visual Studio 2017\\Projects\\ConsoleApp9\\PythonApplication1\\書本識別\\trained_model_weights.h5‘)

print(model.predict(x))
print(model.predict_classes(x))
y=convert2label(model.predict_classes(x))
print(y)

predict的返回其實是softmax層返回的概率數值，是<=1的float

predict_classes返回的是經過one-hot處理後的數值，此時只有0、1兩種數值（最大的value會被返回稱為1，其他都為0）　　

convert2label：

def convert2label(vector):
    string_array=[]
    for v in vector:
        if v==1:
            string_array.append(‘BOOK‘)
        else:
            string_array.append(‘NOT BOOK‘)
    return string_array

這個函數是用來把0、1轉換成文本的，小插曲：

本來這裏是中文的“書本”、“非書本”，後來和女兒一起調試時發現都顯示成了問號，應該是中文字符問題，就改成了英文顯示，和女兒一起寫代碼是種樂趣啊！

本來只是顯示文本，感覺太無聊了，因此加上了opencv顯示圖片+分類文本的代碼段：

for i in range(len(x)):
    cv2.putText(x[i], y[i], (50,50), cv2.FONT_HERSHEY_SIMPLEX, 1, 255, 2)
    cv2.imshow(‘image‘+str(i), x[i])

cv2.waitKey(-1)

技術分享圖片　　

OK， 2018年繼續學習，繼續科學信仰。

用keras作CNN卷積網絡書本分類（書本、非書本）

div 問題：標簽 turn 生成 ring module 數據質量讀取本文介紹如何使用keras作圖片分類（2分類與多分類，其實就一個參數的區別。。。呵呵）先來看看解決的問題：從一堆圖片中分出是不是書本，也就是最終給圖片標簽上：“書本“

1. CNN卷積網絡初識

非線性識別 mage 每一個 alt file img 重要 http 1. 前言卷積神經網絡是一種特殊的深層的神經網絡模型，它的特殊性體現在兩個方面，它的神經元間的連接是非全連接的，同一層中某些神經元之間的連接的權重是共享的（即相同的）。它的非全連接和權值共

用keras小試CNN卷積神經網路應用於人臉識別

Keras是一個簡約，高度模組化的神經網路庫。採用Python / Theano開發。使用Keras如果你需要一個深度學習庫：可以很容易和快速實現原型（通過總模組化，極簡主義，和可擴充套件性）同時支援卷積網路（vision）和複發性的網路（序列資料）。以及兩者的組合。

【Python圖像特征的音樂序列生成】深度卷積網絡，以及網絡核心

img 對比 images 兩個避免 pytho lam 其中 src 這個項目主要涉及到兩個網絡，其中卷積神經網絡用來提取圖片表達的情緒，提取出一個二維向量。網絡結構如圖：詞向量采用預訓練的glove模型，d=50，其他信息包括了圖片的“空曠程度”、亮度、

使用Caffe完成圖像目標檢測和 caffe 全卷積網絡

-h alt avi 5.0 type multi 序號 forward lin 一、【用Python學習Caffe】2. 使用Caffe完成圖像目標檢測標簽： pythoncaffe深度學習目標檢測ssd 2017-06-22 22:08 207人閱讀評論(0)

基於圖卷積網絡的圖深度學習

理論 cdn image 深度大名 end 但我 github 圖像識別基於圖卷積網絡的圖深度學習先簡單回顧一下，深度學習到底幹成功了哪些事情！深度學習近些年在語音識別，圖片識別，自然語音處理等領域可謂是屢建奇功。ImageNet：是一個計算機視

TensorFlow框架(4)之CNN卷積神經網絡詳解

this map ets 多層神經網絡本地 height its 網絡操作 1. 卷積神經網絡 1.1 多層前饋神經網絡　　多層前饋神經網絡是指在多層的神經網絡中，每層神經元與下一層神經元完全互連，神經元之間不存在同層連接，也不存在跨層連接的情況，如圖 11所示。

R-FCN：基於區域的全卷積網絡來檢測物體

速度慢 obj ogl ott 不用插入編碼邊框 sco http://blog.csdn.net/shadow_guo/article/details/51767036 原文標題為“R-FCN: Object Detection via Region-based F

python 實現簡單卷積網絡框架

pen filters rst _array cit shape turn war input 第一步定義卷積核類： class Filter(object): # 濾波器類對卷積核進行初始化 def __init__(self,width,he

卷積網絡輸出尺寸計算

卷積步長圖片網絡 lock 素數是我大小我們先定義幾個參數輸入圖片大小 W×W Filter大小 F×F 步長 S padding的像素數 P 於是我們可以得出 N = (W ? F + 2P )/S+1 卷積網絡輸出尺寸計算

cs231n---卷積網絡可視化

包含著感受向量相同可視化 pos 發現方法縮放本課介紹了近年來人們對理解卷積網絡這個“黑盒子”所做的一些可視化工作，以及deepdream和風格遷移。 1 卷積網絡可視化（1）可視化第一層的濾波器我們把卷積網絡的第一層濾波器權重進行可視化（權重值縮放

CNN卷積神經網絡學習

減少 cti rec 可能步長 nal inpu mar first CNN產生的起因是為了減少神經元數目並減少計算量卷積神經網絡的結構一般包含輸入層 input layer : 用於數據的輸入卷積層 convolutional layer : 使用卷積核進行特

深度視覺經典重讀之一：卷積網絡的蠻荒時代

complete red which Y軸 shift initial 變化 minor 數量最近在找下一篇文章的研究方向，於是重新拿起了入學前看過的一些經典老文，沒想到其中蘊含的信息量這麽大，原來當初naive的我根本沒有領悟其中的精髓。相對於一些瑣碎的技術細節，我更

深度學習——深卷積網絡：實例探究

技術分享模塊變化技術減少開始出了經典問題： 1. 三個經典網絡紅色部分不重要，現在已經不再使用這篇文章較早，比如現在常用max，而當時用avg，當時也沒有softmax 這篇文章讓CV開始重視DL的使用，相對於LeNet-5，它的優點有兩個：更大，使用

Dual Path Networks（DPN）——一種結合了ResNet和DenseNet優勢的新型卷積網絡結構。深度殘差網絡通過殘差旁支通路再利用特征，但殘差通道不善於探索新特征。密集連接網絡通過密集連接通路探索新特征，但有高冗余度。

哪裏 esc 數學 itemid tip 視覺 bat tlist badge 如何評價Dual Path Networks（DPN）？論文鏈接：https://arxiv.org/pdf/1707.01629v1.pdf在ImagNet-1k數據集上，淺DPN超過

TensorFlow 中的卷積網絡

extra .so div 使用 connect rop del glob ges TensorFlow 中的卷積網絡是時候看一下 TensorFlow 中的卷積神經網絡的例子了。網絡的結構跟經典的 CNNs 結構一樣，是卷積層，最大池化層和全鏈接層的混合。這裏你看到

mnist卷積網絡實現

reduce ges drop 模型 log 節點通道數不定 amp 加載MNIST數據 from tensorflow.examples.tutorials.mnist import input_data mnist = input_data.read_data

Python CNN卷積神經網絡代碼實現

truncate none batch odi drop variable 函數 std .com 1 # -*- coding: utf-8 -*- 2 """ 3 Created on Wed Nov 21 17:32:28 2018 4 5 @autho

CNN卷積神經網路--反向傳播（2，前向傳播）

　卷積層：卷積層的輸入要麼來源於輸入層，要麼來源於取樣層，如上圖紅色部分。卷積層的每一個map都有一個大小相同的卷積核，Toolbox裡面是5*5的卷積核。下面是一個示例，為了簡單起見，卷積核大小為2*2，上一層的特徵map大小為4*4，用這個卷積在圖片上滾一遍，得到一個一個(4-2+1)*（4-2+1）=3

Linux內核project導論——網絡：Filter（LSF、BPF、eBPF）

linux內核空間使用自己 ket iat cls number 那種機制概覽 LSF(Linux socket filter)起源於BPF（Berkeley Packet Filter）。基礎從架構一致。但使用更簡單。LSF內部的BP

用keras作CNN卷積網絡書本分類（書本、非書本）

相關推薦