Cifar-10影象分類任務

阿新 • • 發佈：2018-12-15

Cifar-10資料集

Cifar-10資料集是由10類32*32的彩色圖片組成的資料集，一共有60000張圖片，每類包含6000張圖片。其中50000張是訓練集，1000張是測試集。

1. 獲取每個batch檔案中的字典資訊

import pickle
def unpickle(file):
	fo = open(file,'rb')
	dick = pickle.load(fo,encoding='latin1')
	fo.close()
	return dick

在字典結構中，每一張圖片是以被展開的形式儲存，即一張32*32*3的圖片被展開成3072長度的list，每一個數據的格式為unit8，前1024為紅色通道，中間1024為綠色通道，後1024為藍色通道。

2.影象預處理。對資料進行標準化操作，按照一定比例進行縮放，使其落入一個特定的區域，便於操作處理。提高了處理速度。

import numpy as np
def clean(data):
	imgs = data.reshape(data.shape[0],3,32,32)
	grayscale_imgs = imgs.mean(1)
	cropped_imgs = grayscale_imgs[:,4:28,4:28]
	img_data = cropped_imgs.reshape(data.shape[0],-1)
	img_size = np.shape(img_data)[1]
	means = np.mean(img_data,axis=1)
	meansT = means.reshape(len(means),1)
	stds = np.std(img_data,axis=1)
	stdsT = stds.reshape(len(stds),1)
	adj_stds = np.maximum(stdsT,1.0/np.sqrt(img_size))
	normalized = (img_data - meansT) / adj_stds
	return normalized

mean(axis)函式：求平均值。對m*n的矩陣來說

axis=0:壓縮行，對各列求平均值，返回1*n矩陣。

axis=1:壓縮列，對各行求平均值，返回m*1矩陣。

axis不設定值，對m*n個數求平均值，返回一個實數。

reshape()函式：改變陣列的形狀。

reshape((2,4)):變為一個二維陣列；reshape((2,2,2)):變為一個三維陣列

當有一個引數為-1時，會根據另一個引數的維度計算陣列的另外一個shape屬性值。

如reshape(data.shape[0],-1):行為data.shape[0]行，列自動算出。data.shape[0]:data第一維的長度。

3.影象資料讀取

def read_data(directory):
	names = unpickle('{}/batches.meta'.format(directory))['label_names']
	
	print('dede')
	print('names',names)
	print('dede')
	
	data,labels = [],[]
	#一個batch一個batch的去讀取batch資料
	for i in range(1,6):
		filename = '{}/data_batch_{}'.format(directory,i)
		batch_data = unpickle(filename)
		#拼加操作
		if len(data) > 0:
			data = np.vstack((data,batch_data['data']))
			labels = np.hstack((labels,batch_data['labels']))
		else:
			data = batch_data['data']
			labels = batch_data['labels']
			
	print('haha')		
	print(np.shape(data),np.shape(labels))	#輸出data和labels的長度
	print('haha')	
	
	data = clean(data)
	data = data.astype(np.float32)
	return names,data,labels

下圖為names的值，圖片集中的分類

可以看出，data和labels的資料型別為ndarray,batch_data的資料型別為字典型別。

hstack(a,b,c,d):水平把陣列堆疊起來

vstack(a,b,c,d):豎直把陣列堆疊起來

4.顯示資料

import matplotlib.pyplot as plt
import random
random.seed(1)	

#把資料讀取進來
names,data,labels = read_data('D://hh/cifar-10-batches-py')

def show_some_examples(names,data,labels):
	plt.figure()
	#繪製一個子圖 4*4結構
	rows,cols = 4,4
	random_idxs = random.sample(range(len(data)),rows * cols)
	for i in range(rows*cols):
		plt.subplot(rows,cols,i+1)
		j = random_idxs[i]
		plt.title(names[labels[j]])
		img = np.reshape(data[j,:],(24,24))
		plt.imshow(img,cmap='Greys_r')
		plt.axis('off')
	plt.tight_layout()
	plt.savefig('cifar_examples,png')
	
show_some_examples(names,data,labels)	
print('stop1')

繪製的圖

5.經過卷積後的結果

import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf

names,data,labels = read_data('D://hh/cifar-10-batches-py')	

def show_conv_results(data,filename = None):
	plt.figure()
	#子圖 4行8列  每一個子圖都是其中的一個特徵圖
	rows,cols = 4,8		
	for i in range(np.shape(data)[3]):
		img = data[0,:,:,i]		#分別取當前的每一個特徵圖
		plt.subplot(rows,cols,i+1)
		plt.imshow(img,cmap='Greys_r',interpolation='none')
		plt.axis('off')
	if filename:
		plt.savefig(filename)
	else:
		plt.show()
print('stop2')	
#權重引數
def show_weights(W,filename=None):
	plt.figure()
	rows,cols = 4,8
	for i in range(np.shape(W)[3]):
		img = W[:,:,0,i]
		plt.subplot(rows,cols,i+1)
		plt.imshow(img,cmap='Greys_r',interpolation='none')
		plt.axis('off')
	if filename:
		plt.savefig(filename)
	else:
		plt.show()

#顯示
raw_data = data[4,:]		
raw_img = np.reshape(raw_data,(24,24))
plt.figure()
plt.imshow(raw_img,cmap='Greys_r')
plt.show()

6.引數設定

x = tf.reshape(raw_data,shape=[-1,24,24,1])
W = tf.Variable(tf.random_normal([5,5,1,32])) 	#輸入為1 輸出為32
b = tf.Variable(tf.random_normal([32]))

7.卷積操作

conv = tf.nn.conv2d(x,W,strides=[1,1,1,1],padding='SAME')	#卷積
conv_with_b = tf.nn.bias_add(conv,b)		#卷積後加偏置項
conv_out = tf.nn.relu(conv_with_b)		#啟用函式

k = 2
maxpool = tf.nn.max_pool(conv_out,ksize=[1,k,k,1],strides=[1,k,k,1], padding='SAME')

8.檢視中間結果

with tf.Session() as sess:
	sess.run(tf.global_variables_initializer()) 
	
	W_val = sess.run(W)
	print('weight:')
	show_weights(W_val)
	
	#開始卷積
	conv_val = sess.run(conv)
	print("convolution results:")
	print(np.shape(conv_val))
	show_conv_results(conv_val)
	
	#relu
	conv_out_val = sess.run(conv_out)
	print("convolution with blas and relu:")
	print(np.shape(conv_out_val))
	show_conv_results(conv_out_val)
	
	#池化
	maxpool_val = sess.run(maxpool)
	print("maxpool after all the convolutions:")
	print(np.shape(maxpool_val))
	show_conv_results(maxpool_val)

weight:

卷積：

relu:

最大池化：

9.構建網路模型

x = tf.placeholder(tf.float32,[None,24*24])	
y = tf.placeholder(tf.float32,[None,len(names)])
W1 = tf.Variable(tf.random_normal([5,5,1,64]))
b1 = tf.Variable(tf.random_normal([64]))
W2 = tf.Variable(tf.random_normal([5,5,64,64]))
b2 = tf.Variable(tf.random_normal([64]))
W3 = tf.Variable(tf.random_normal([6*6*64,1024]))
b3 = tf.Variable(tf.random_normal([1024]))
W_out = tf.Variable(tf.random_normal([1024,len(names)]))
b_out = tf.Variable(tf.random_normal([len(names)]))

10.卷積池化操作函式

def conv_layer(x,W,b):
	conv = tf.nn.conv2d(x,W,strides=[1,1,1,1],padding='SAME')
	conv_with_b = tf.nn.bias_add(conv,b)
	conv_out = tf.nn.relu(conv_with_b)
	return conv_out
	
def maxpool_layer(conv,k=2):
	return tf.nn.max_pool(conv,ksize=[1,k,k,1],strides=[1,k,k,1],padding='SAME')

11.把引數組合到一起

def model():
	x_reshapes = tf.reshape(x,shape=[-1,24,24,1])
	#卷積層
	conv_out1 = conv_layer(x_reshapes,W1,b1)
	#池化層
	maxpool_out1 = maxpool_layer(conv_out1)
	#提出了LRN層(區域性響應層)，對區域性神經元的活動建立競爭機制，使得其中響應比較大的值變得相對更大，並抑制其他反饋比較小的神經元，
	#增強了模型的泛化能力，使表達能力增強
	norm1 = tf.nn.lrn(maxpool_out1,4,bias=1.0,alpha=0.001/9.0,beta=0.75)
	#第二次卷積池化
	conv_out2 = conv_layer(norm1,W2,b2)
	norm2 = tf.nn.lrn(conv_out2,4,bias=1.0,alpha=0.01/9.0,beta=0.75)
	maxpool_out2 = maxpool_layer(norm2)
	
	maxpool_reshaped = tf.reshape(maxpool_out2,[-1,W3.get_shape().as_list()[0]])
	local = tf.add(tf.matmul(maxpool_reshaped,W3),b3)
	local_out = tf.nn.relu(local)
	
	out = tf.add(tf.matmul(local_out,W_out),b_out)
	return out

12. 指定學習率和損失函式

learning_rate = 0.001
model_op = model()
cost = tf.reduce_mean(
	tf.nn.softmax_cross_entropy_with_logits(logits=model_op,labels=y)
)	
train_op = tf.train.AdamOptimizer(learning_rate=learning_rate).minimize(cost)

correct_pred = tf.equal(tf.argmax(model_op,1),tf.argmax(y,1))
accuracy = tf.reduce_mean(tf.cast(correct_pred,tf.float32))

13.迭代

with tf.Session() as sess:
	sess.run(tf.global_variables_initializer())
	#把標籤轉換成10個概率
	onehot_labels = tf.one_hot(labels,len(names),axis=-1)
	onehot_vals = sess.run(onehot_labels)
	batch_size = 64
	print('batch size',batch_size)
	for j in range(0,1000):
		avg_accuracy_val = 0
		batch_count = 0
		for i in range(0,len(data),batch_size):
			batch_data = data[i:i+batch_size,:]
			batch_onehot_vals = onehot_vals[i:i+batch_size,:]
			_,accuracy_val = sess.run([train_op,accuracy],feed_dict={x:batch_data,y:batch_onehot_vals})
			avg_accuracy_val += accuracy_val
			batch_count += 1
		avg_accuracy_val /= batch_count
		print('Epoch[],Avg accuracy []',format(j,avg_accuracy_val))
		
		print('Epoch [],Avg accuracy []',format(j,avg_accuracy_val))

Cifar-10影象分類任務

Cifar-10資料集 Cifar-10資料集是由10類32*32的彩色圖片組成的資料集，一共有60000張圖片，每類包含6000張圖片。其中50000張是訓練集，1000張是測試集。 1. 獲取每個batch檔案中的字典資訊 import pickle def u

Pytorch實戰2：ResNet-18實現Cifar-10影象分類（測試集分類準確率95.170%）（轉）

Pytorch實戰2：ResNet-18實現Cifar-10影象分類實驗環境: torchvision 0.2.1 Python 3.6 CUDA8+cuDNN v7 (可選) Win10+Pycharm 整個專案程式碼：點選這裡 Res

用keras實現基本的影象分類任務

資料集介紹 fashion mnist資料集是mnist的進階版本，有10種對應的結果訓練集有60000個，每一個都是28*28的影象，每一個對應一個標籤（0-9）表示測試集有10000個程式碼 import tensorflow as tf import keras import numpy

Tensorflow使用Inception思想實現CIFAR-10十分類demo

使用Inception思想實現一個簡單的CIFAR-10十分類.最主要的是領會Inception的結構. Inception結構圖如下: 思想: 　　分別使用1*1,3*3,5*5卷積核和一個3*3最大池化層對上一層進行處理,然後將輸入進行合併. 　

Tensorflow官網CIFAR-10資料分類教程程式碼詳解

標題概述對CIFAR-10 資料集的分類是機器學習中一個公開的基準測試問題，本教程程式碼通過解決CIFAR-10資料分類任務，介紹了Tensorflow的一些高階用法，演示了構建大型複雜模型的一些重要技巧，著重於建立一個規範的網路組織結構，訓練並進行評估，為建立更大規模更加複雜的

Tensorflow使用Resnet思想實現CIFAR-10十分類demo

關於Resnet殘差網路的介紹已經非常多了,這裡就不在贅述.使用Tensorflow寫了一個簡單的Resnet,對CIFAR-10資料集進行十分類.關鍵步驟都寫了詳細註釋,雖然最後的精度不高,但還是學習Resnet的思想為主. import tensorf

Keras卷積神經網路識別CIFAR-10影象（2）

上一篇文章簡單介紹了卷積神經網路的結構，本篇文章則會利用上一篇文章的理論知識搭建神經網路模型來識別CIFAR-10影象。 2.Keras卷積神經網路識別CIFAR-10影象首先簡單介紹一下什麼是CIFAR-10，CIFAR-10是是用於物件識別的已建立的計算機

計算機視覺（四）：使用K-NN分類器對CIFAR-10進行分類

1 - 引言之前我們學習了KNN分類器的原理，現在讓我們將KNN分類器應用在計算機視覺中，學習如何使用這個演算法來進行圖片分類。 2 - 準備工作建立專案結構如圖所示在datasets檔案中下載資料集Cifar-10 k_nearest_neighbo

使用VGG模型自定義影象分類任務

前言網上關於VGG模型的文章有很多，有介紹演算法本身的，也有程式碼實現，但是很多程式碼只給出了模型的結構實現，並不包含資料準備的部分，這讓人很難愉快的將程式碼遷移自己的任務中。為此，這篇部落格接下來圍繞著如何使用VGG實現自己的影象分類任務，從資料準備到實驗

keras 影象識別例項CIFAR-10分類，匯入資料，檢視最初9張圖片

圖片識別是卷積神經網路的主要應用之一。這個資料集是有Alex Krizhevsky 、 Vinod Nair 和GeoffreyHinton手機整理。共包含了60000張32* 32的彩色影象，50000張用於訓練模型、10000張用於評估模型。訓練的資料集被均勻分成10個類

tensorflow下實現ResNet網路對資料集cifar-10的影象分類

DenseNet傳送門：DenseNet先來簡單講講ResNet的網路結構。ResNet的出現是為了解決深度網路中由於層數太多，導致的degradation problem(退化問題），作者在原論文中對比了較為“耿直”的深度卷積網路（例如以VGG為原型，不斷加深層數）在不同層

Caffe深度學習進階之Cifar-10分類任務（上）

前言 Cifar-10資料集是深度學習領域一個常見的資料集。Cifar-10由60000張32*32的RGB彩色圖片構成，一共包含有飛機、汽車、鳥、毛、鹿、狗、青蛙、馬、船、卡車這10個類別。50000張訓練，10000張測試。常被用來作為分類任務來評價深度學

【Pytorch】CIFAR-10分類任務

CIFAR-10資料集共有60000張32*32彩色圖片，分為10類，每類有6000張圖片。其中50000張用於訓練，構成5個訓練batch，每一批次10000張圖片，其餘10000張圖片用於測試。 CIFAR-10資料集下載地址：點選下載資料讀取，這裡選擇下載py

Keras入門（五）搭建ResNet對CIFAR-10進行影象分類

本文將會介紹如何利用Keras來搭建著名的ResNet神經網路模型，在CIFAR-10資料集進行影象分類。資料集介紹 CIFAR-10資料集是已經標註好的影象資料集，由Alex Krizhevsky, Vinod Nair, and Geoffrey Hinton三人收集，其訪問網址為：https:

用KNN演算法分類CIFAR-10圖片資料

KNN分類CIFAR-10，並且做Cross Validation，CIDAR-10資料庫資料如下： knn.py : 主要的試驗流程 from cs231n.data_utils import load_CIFAR10 from cs231n.classifiers i

基於Keras：CIFAR-10-分類

一、概述 CIFAR-10是一個比較經典的資料集，主要用於影象分類；該資料集共有60000張彩色影象，這些影象是32*32，分為10個類，每類6000張圖。這裡面有50000張用於訓練，構成了5個訓練批，每一批10000張圖；另外10000用於測試，單獨構成

北大人工智慧網課攻略[3]:cifar-10十種分類

北大人工智慧網課階段測試只有一個。在第七講中老師使用了lenet5網路進行了mnist手寫字型的識別，然後留了一個使用lenet5網路進行十種目標識別的測試。與之前識別手寫體最大的不同在於，我們無法使用原來老師的影象讀入方式，它不再是一個壓縮包下的一個檔案

【Keras】從兩個實際任務掌握影象分類

我們一般用深度學習做圖片分類的入門教材都是MNIST或者CIFAR-10，因為資料都是別人準備好的，有的甚至是一個函式就把所有資料都load進來了，所以跑起來都很簡單，但是跑完了，好像自己還沒掌握圖片分類的完整流程，因為他們沒有經歷資料處理的階段，所以談不上走過一遍深度學習的

計算機視覺（八）：提取Cifar-10資料集的HOG、HSV特徵並使用神經網路進行分類

1 - 引言之前我們都是將整張圖片輸入進行分類，要想進一步提升準確率，我們就必須提取出圖片更容易區分的特徵，再將這些特徵當做特徵向量進行分類。在之前我們學了一些常用的影象特徵，在這次實驗中，我們使用了兩種特徵梯度方向直方圖（HOG）顏色直方圖（HSV）

計算機視覺（七）：構建兩層的神經網路來分類Cifar-10資料集

1 - 引言之前我們學習了神經網路的理論知識，現在我們要自己搭建一個結構為如下圖所示的神經網路，對Cifar-10資料集進行分類前向傳播比較簡單，就不在贅述反向傳播需要注意的是，softmax的反向傳播與之前寫的softmax程式碼一樣。神經網路內部的反向傳播權重偏導就是前面

Cifar-10影象分類任務

相關推薦