Deep Neural Network for Image Classification:Application

阿新 • • 發佈：2019-01-31

上一篇文章中實現了一個兩層神經網路和L層神經網路需要用到的函式

本篇我們利用這些函式來實現一個深層神經網路來實現圖片的分類

1.首先是匯入需要的包

import time
import numpy as np
import h5py
import matplotlib.pyplot as plt
import scipy
from PIL import Image
from scipy import ndimage
from dnn_app_utils_v2 import *
np.random.seed(1)  #設定隨機數種子，使產生的隨機數不變

2.載入資料集（採用的資料集是第二個作業的"cat vs non-cat" dataset）,

訓練資料集在train_cat.h5，測試資料集在test_cat.h5中

之前採用的Logistic Regression來區分是否是貓達到的正確率只有70%,顯然，正確率並不高，因此，通過建立一個神經網路來提升正確率

def load_data():
    train_dataset = h5py.File('train_cat.h5', "r")
    train_set_x_orig = np.array(train_dataset["train_set_x"][:])  # your train set features
train_set_y_orig = np.array(train_dataset["train_set_y" 
][:])  # your train set labels
test_dataset = h5py.File('test_cat.h5', "r")
    test_set_x_orig = np.array(test_dataset["test_set_x"][:])  # your test set features
test_set_y_orig = np.array(test_dataset["test_set_y"][:])  # your test set labels
classes = np.array(test_dataset["list_classes"][:])  # the list of classes
 
train_set_y_orig = train_set_y_orig.reshape((1, train_set_y_orig.shape[0]))
    test_set_y_orig = test_set_y_orig.reshape((1, test_set_y_orig.shape[0]))

    return train_set_x_orig, train_set_y_orig, test_set_x_orig, test_set_y_orig, classes

呼叫函式

rain_x_orig,train_y,test_x_orig,test_y,classes=load_data()
# print(train_x_orig.shape)  # (209, 64, 64, 3)
# print(train_y.shape)   #(1,209)
# print(test_x_orig.shape)  #(50, 64, 64, 3)
# print(test_y.shape)  #(1, 50)
# print(classes.shape)  #(2,)
# print(classes)   #[b'non-cat' b'cat']
# index=10
# plt.imshow(train_x_orig[index])
# plt.show()
# print("y="+str(train_y[0][index])+".It's a "+classes[train_y[0][index]].decode("utf-8")+" picture")
m_train=train_x_orig.shape[0]
num_px=train_x_orig.shape[1]
m_test=test_x_orig.shape[0]
train_x_flatten=train_x_orig.reshape(train_x_orig.shape[0],-1).T  #shape:(64*64*3, 209)
test_x_flatten=test_x_orig.reshape(test_x_orig.shape[0],-1).T   #shape:(64*64*3,50)
train_x=train_x_flatten/255  #standard data to have feature value between a and 1
test_x=test_x_flatten/255

此處，如果你想把train_cat.h5，test_cat.h5中所有的圖片讀出並分別儲存到資料夾"F:\train_cat"和“F:\test_cat”中，就把下面的程式碼複製下來

t=0
for i in range(209):
    # plt.imshow(train_x_orig[i])
img=train_x_orig[i]
    dst = os.path.join(os.path.abspath('F:\\train_cat'), "%06d" % t + '.jpg')
    img = Image.fromarray(img)
    img.save(dst)
    plt.show()
    print("y="+str(train_y[0][i])+".It's a "+classes[train_y[0][i]].decode("utf-8")+" picture")
    t=t+1
k=0
for i in range(50):
    # plt.imshow(train_x_orig[i])
img=test_x_orig[i]
    dst = os.path.join(os.path.abspath('F:\\test_cat'), "%06d" % t + '.jpg')
    img = Image.fromarray(img)
    img.save(dst)
    plt.show()
    print("y="+str(test_y[0][i])+".It's a "+classes[test_y[0][i]].decode("utf-8")+" picture")
    k=k+1

3.兩層神經網路

n_x=12288
n_h=7
n_y=1
layer_dims=(n_x,n_h,n_y)
def two_layer_model(X,Y,layer_dims,learning_rate=0.0075,num_iterations=3000,print_cost=False):
    """Implements a two layer neural network:linear-relu-linear-sigmoid
    X:input data:(n_x,number of examples)
    Y:true labels:(1,number of examples)
    layer_dims:dimension of the layers(n_x,n_h,n_y)
    num_iterations:number of iterations of the optimization loop
    returns:
    :parameters--a dictionary containing w1，w2,b1,b2
    """
np.random.seed(1)
    grads={}
    costs=[]
    m=X.shape[1]
    (n_x, n_h, n_y)=layer_dims
    parameters=initialize_parameters(n_x,n_h,n_y)   #W1,b1,W2,b2
W1=parameters["W1"]
    b1=parameters["b1"]
    W2=parameters["W2"]
    b2=parameters["b2"]
    for i in range(0,num_iterations):
        #forward propagation
A1,cache1=linear_activation_forward(X,W1,b1,activation="relu")
        A2,cache2=linear_activation_forward(A1,W2,b2,activation="sigmoid")
        #compoute cost
cost=compute_cost(A2,Y)
        dA2=-(np.divide(Y,A2)-np.divide(1-Y,1-A2))
        #backward propagation
dA1,dW2,db2=linear_activation_backward(dA2,cache2,activation="sigmoid")
        dA0,dW1,db1=linear_activation_backward(dA1,cache1,activation="relu")
        grads["dW1"]=dW1
        grads["db1"]=db1
        grads["dW2"]=dW2
        grads["db2"]=db2
        #update parameters
parameters=update_parameters(parameters,grads,learning_rate)
        #retrieve W1,b1,W2,b2 from parameters
W1 = parameters["W1"]
        b1 = parameters["b1"]
        W2 = parameters["W2"]
        b2 = parameters["b2"]
        if print_cost and i%100==0:
            print("cost after iterations{}:{}".format(i,np.squeeze(cost)))
        if print_cost and i % 100 == 0:
            costs.append(cost)
        #plot the cost
plt.plot(np.squeeze(costs))
    plt.ylabel('cost')
    plt.xlabel('iterations(per hundreds)')
    plt.title("learning rate="+str(learning_rate))
    plt.show()
    return parameters

呼叫上面的函式

parameters=two_layer_model(train_x,train_y,layer_dims=(n_x,n_h,n_y),learning_rate=0.0075,num_iterations=3000,print_cost=True)

prediction_train=predict(train_x,train_y,parameters)
prediction_test=predict(test_x,test_y,parameters)

訓練集 Accuracy: 1.0

測試集 Accuracy: 0.72

顯然測試集正確率並不高，因此我們採用多層神經網路

layer_dims=[12288,20,7,5,1]  #5-layer model
def L_layer_model(X,Y,layer_dims,learning_rate=0.0075,num_iterations=3000,print_cost=False):
    """
    Implements a L-layer neural network:[linear->relu]*(L-1)->linear->sigmoid
:param X: (numbers of examples,num_px*num_px*3)
:param Y: (1,numbers of examples)
:param layer_dims:
:param learning_rate:
:param num_iterations:numbers of the optimization loop
:param print_cost:
:return:  paramters learned by the model,they can be used to predict
    """
np.random.seed(1)
    costs=[]
    #初始化引數
parameters=initialize_parameters_deep(layer_dims)
    for i in range(0,num_iterations):
        AL,caches=L_model_forward(X,parameters)
        cost=compute_cost(AL,Y)
        grads=L_model_backward(AL,Y,caches)
        parameters=update_parameters(parameters,grads,learning_rate=0.0075)
        if print_cost and i%100==0:
            print("cost after iterations{}:{}".format(i,np.squeeze(cost)))
        if print_cost and i % 100 == 0:
            costs.append(cost)
    # plot the cost
plt.plot(np.squeeze(costs))
    plt.ylabel('cost')
    plt.xlabel('iterations(per hundreds)')
    plt.title("learning rate=" + str(learning_rate))
    plt.show()
    return parameters

呼叫該函式：

parameters=L_layer_model(train_x,train_y,layer_dims ,learning_rate=0.0075,num_iterations=2500,print_cost=True)
pred_train=predict(train_x,train_y,parameters)
pred_test=predict(test_x,test_y,parameters)
print("parameters="+str(parameters))

訓練集 Accuracy: 0.985645933014

測試集 Accuracy: 0.8

利用上面學得的引數，你可以對自己的圖片進行預測

my_image="000039.jpg"
my_label_y=[0]
fname="F:\\test_cat\\"+my_image
image=np.array(ndimage.imread(fname,flatten=False))
my_image=scipy.misc.imresize(image,size=(num_px,num_px)).reshape((num_px*num_px*3,1))
print(my_image.shape)

my_predicted_image=predict(my_image,my_label_y,parameters)

print(my_predicted_image)
plt.imshow(image)
print("y="+str(np.squeeze(my_predicted_image))+", your L-layer model predicts is a "+classes[int

(np.squeeze(my_predicted_image))].decode("utf-8")+" picture")

該神經網路採用的資料集圖片大小是64*64px，而我在網上下載的圖片都很大，所以在進行resize後，出現圖片的嚴重失真，對圖片的特徵辨別不正確，因此，並沒有在我自己的圖片上達到很好的效果

Deep Neural Network for Image Classification: Application

cal pack 分享圖片 his exp params next min super When you finish this, you will have finished the last programming assignment of Week 4, and a

01神經網路和深度學習-Deep Neural Network for Image Classification: Application-第四周程式設計作業2

一、兩層神經網路模型：LINEAR->RELU->LINEAR->SIGMOID #coding=utf-8 import time import numpy as np import h5py import matplotlib.pyplot as

第四周程式設計作業（二）-Deep Neural Network for Image Classification: Application

Deep Neural Network for Image Classification: Application When you finish this, you will have finished the last programming assignment of Week 4

Deep Neural Network for Image Classification:Application

上一篇文章中實現了一個兩層神經網路和L層神經網路需要用到的函式本篇我們利用這些函式來實現一個深層神經網路來實現圖片的分類 1.首先是匯入需要的包 import time import numpy as np import h5py import matplotlib.p

深度學習論文翻譯解析（二）：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition

論文標題：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition 論文作者： Baoguang Shi, Xiang B

論文筆記：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application

1.歷史方法 1）基於字元的DCNN,比如photoOCR.單個字元的檢測與識別。要求單個字元的檢測器效能很強，crop的足夠好。 2）直接對圖片進行分類。9萬個單詞，組合成無數的單詞，無法直接應用 3）RNN,訓練和測試均不需要每個字元的位置。但是需要預處理，從圖片得到特

[深度學習] 影象反捲積的深度積神經網路 Deep Convolutional Neural Network for Image Deconvolution

《影象反捲積的深度積神經網路》《Deep Convolutional Neural Network for Image Deconvolution》 Li Xu, Jimmy SJ. Ren, Ce Liu, Jiaya Jia NIPS 2014 pdf 摘要

《An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its...》論文閱讀之CRNN

An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition paper: CRNN 翻譯：CRNN

《17.Residual Attention Network for Image Classification》

動機深度學習中的Attention，源自於人腦的注意力機制，當人的大腦接受到外部資訊，如視覺資訊、聽覺資訊時，往往不會對全部資訊進行處理和理解，而只會將注意力集中在部分顯著或者感興趣的資訊上，這樣有助於濾除不重要的資訊，而提升資訊處理的效率。最早將Attention利用

Recurrent Neural Network for Text Classification with Multi-Task Learning

引言 Pengfei Liu等人在2016年的IJCAI上發表的論文，論文提到已存在的網路都是針對單一任務進行訓練，但是這種模型都存在問題，即缺少標註資料，當然這是任何機器學習任務都面臨的問題。為了應對資料量少，常用的方法是使用一個無監督的預訓練模型，比如詞向量，實驗中也取得了不錯

《PCANet: A Simple Deep Learning Baseline for Image Classification》

對照論文中的示例圖和文章給出的程式碼來梳理從圖中看到，整個網路有三個關鍵步驟，Patch-mean removal 、 PCA filter convolution與Binary quantization &mapping ，分別是區域性均值化、

PCANet: A Simple Deep Learning Baseline for Image Classification?--名詞解釋

1 上取樣與下采樣縮小影象（或稱為下采樣（subsampled）或降取樣（downsampled））的主要目的有兩個：使得影象符合顯示區域的大小生成對應影象的縮圖下采樣原理：對於一幅影象I尺寸為M*N，對其進行s倍下采樣，即得到(M/s)*(N/s)尺寸的得解析度影象，當然s應該是

論文閱讀筆記之——《DN-ResNet: Efficient Deep Residual Network for Image Denoising》

本文提出的DN-ResNet，就是a deep convolutional neural network (CNN) consisting of several residual blocks (ResBlocks).感覺有點類似於SRResNet的思路。並且對於訓練這個作者所提出的網路，作者還

論文筆記：DRAW: A Recurrent Neural Network For Image Generation

DRAW: A Recurrent Neural Network For Image Generation 2019-01-14 19:42:50 Paper：http://proceedings.mlr.press/v37/gregor15.pdf 本文將 V

論文筆記：Residual Attention Network for Image Classification

前言深度學習中的Attention，源自於人腦的注意力機制，當人的大腦接受到外部資訊，如視覺資訊、聽覺資訊時，往往不會對全部資訊進行處理和理解，而只會將注意力集中在部分顯著或者感興趣的資訊上，這樣有助於濾除不重要的資訊，而提升資訊處理的效率。最早將A

Residual Attention Network for Image Classification, cvpr17

人至懶則無敵。 cvpr17的論文，很有意思，值得一讀和復現。（筆者懶，還是坐等開源吧）還是老樣子，看圖說話，具體細節，請看論文。圖1說明了越high-level的part feature及其mask越會focus在object或者parts of objec

【論文閱讀】Learning a Deep Convolutional Network for Image Super-Resolution

開發十年，就只剩下這套架構體系了！ >>>

Deep Unfolding Network for Image Super-Resolution 論文解讀

# Introduction 超分是一個在 low level CV 領域中經典的病態問題，比如增強影象視覺質量、改善其他 high level 視覺任務的表現。Zhang Kai 老師這篇文章在我看到的超分文章裡面是比較驚豔我的一篇，首先他指出基於學習(learning-based)的方法表現出高效，且比傳

論文筆記《The application of two-level attention models in deep convolutional neural network for FGVC》

這篇文章是2015年的，作者使用提出了兩級注意力的方法，來進行細粒度分類。以鳥類分類為例。作者在object-level和part-level兩個級別分別對鳥進行分類，將得到的分數相加綜合後得到最後的分類結果。上圖是鳥分類在object-level的一個流程圖，先用select

論文閱讀筆記十八：ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation

每一個內核基於 proc vgg 包含 rep 重要偏差論文源址：https://arxiv.org/abs/1606.02147 tensorflow github: https://github.com/kwotsin/TensorFlow-ENet 摘要

Deep Neural Network for Image Classification:Application

相關推薦