TensorFlow實現卷積神經網路(進階)
此模型中如果使用100k個batch,並結合學習速率的decay(即每隔一段時間將學習速率下降一個比率),正確率可以高達86%。模型中需要訓練的引數約為100萬個,而預測時需要進行的四則運算總量在2000萬次左右。所以這個卷積神經網路模型中,使用一些技巧。
(1)對weight進行L2的正則化。
(2)對圖片進行翻轉,隨機剪下等資料增強,製造更多樣本。
(3)在每個卷積-最大池化層後面使用LRN層,增強模型的泛化能力。
卷積加池化的組合目前已經是做影象識別的一個標準組件了。卷積層主要做特徵提取,全連線層開始多特徵進行組合匹配,並進行分類。卷積層的訓練相對於全連線層更復雜,訓練全連線層基本是進行一些矩陣的乘法運算。
下載TensorFow Model,在構建模型時會用到讀取CTFAR-10資料的類(cifar10.py和cifar10_input.py)(CTFAR-10一個經典的資料集)
git clone [email protected].com:tensorflow/models.git
cd models/tutorials/image/cifar10
卷積神經網路結構:
conv1 卷積層和啟用函式
pool1 最大池化
norm1 LRN
conv2 卷積層和啟用函式
norm2 LRN
pool2 最大池化層
local3 全連線層和啟用函式
local4 全連線層和啟用函式
logits 模型Inference的輸出結果
# coding:UTF-8
# 載入常用庫,NumPy的time,並載入TlensorFow Models中的自動下載、讀取CIFAR-10資料的類。
import cifar10,cifar10_input
import tensorflow as tf
import numpy as np
import time
########輸入資料########
# 訓練論數、batch大小(3000個batch,每個batch包含128個樣本)。
max_steps = 3000
batch_size = 128
# 下載CIFAR-10資料的預設路徑
data_dir = '/tmp/cifar10_data/cifar-10-batches-bin'
########初始化權重########
# 定義初始化weight的函式,依然使用tf.truncated_normal截斷的正態分佈來初始化權重。
# 這裡給weight加一個L2的loss,相當於做了一個L2的正則化處理。這個collection名為“losses”,會在後面計算總體loss時被用上
def variable_with_weight_loss(shape, stddev, wl):
var = tf.Variable(tf.truncated_normal(shape, stddev = stddev))
if wl is not None:
weight_loss = tf.multiply(tf.nn.l2_loss(var), wl, name = 'weight_loss')
tf.add_to_collection('losses', weight_loss)
return var
########資料處理########
# 把cifar10的資料解壓到data_dir中,然後將下一行程式碼註釋掉,取消執行
# (用到cifar-10.py)使用CIFAR-10下載資料集,並解壓展開到其預設位置
cifar10.maybe_download_and_extract()
# 使用cifar10_input類中的distorted_input函式產生訓練需要使用的資料,返回的是已經封裝好的tensor,每次執行都會生成一個batch_size的數量的樣本。
images_train, labels_train = cifar10_input.distorted_inputs(data_dir = data_dir, batch_size = batch_size)
# 使用cifar10_input.inputs函式生成測試資料。需要裁剪圖片正中間的24*24的區塊,並進行資料標準化操作。
images_test, labels_test = cifar10_input.inputs(eval_data = True, data_dir = data_dir, batch_size = batch_size)
# 建立輸入資料的placeholder。batche_size在之後定義網路結構時被用到了,所以資料尺寸的第一個值樣本條數需要提前設定。
image_holder = tf.placeholder(tf.float32, [batch_size, 24, 24, 3])
label_holder = tf.placeholder(tf.int32, [batch_size])
########設計網路結構########
# 第一個卷積層
# 建立卷積核並進行初始化,不對第一個卷積層的weight進行L2正則
weight1 = variable_with_weight_loss(shape = [5,5,3,64], stddev = 5e-2, wl = 0.0)
# 對輸入資料進行卷積操作
kernel1 = tf.nn.conv2d(image_holder, weight1, [1,1,1,1], padding = 'SAME')
# 這層的bias全部初始化為0,再將卷積的結果加上bias
bias1 = tf.Variable(tf.constant(0.0, shape = [64]))
# 使用啟用函式進行非線性化
conv1 = tf.nn.relu(tf.nn.bias_add(kernel1, bias1))
# 使用尺寸為3*3且步長為2*2的最大池化層處理資料,最大池化層的尺寸和步長不一致,增加資料的豐富性
pool1 = tf.nn.max_pool(conv1, ksize = [1,3,3,1], strides = [1,2,2,1], padding = 'SAME')
# 使用LRN對結果進行處理,對區域性神經元的活動建立競爭環境,增強模型的泛化能力
norm1 = tf.nn.lrn(pool1, 4, bias = 1.0, alpha = 0.001/9.0, beta = 0.75)
# 第二個卷積層(與上一層相似)
# 上一層的卷積核數量為64(即輸出64個通道)。本層卷積核的第三維度輸入通道數為64。
weight2 = variable_with_weight_loss(shape = [5,5,64,64], stddev = 5e-2, wl = 0.0)
kernel2 = tf.nn.conv2d(norm1, weight2, [1,1,1,1], padding = 'SAME')
# bias值全部初始化為0.1。
bias2 = tf.Variable(tf.constant(0.1, shape = [64]))
conv2 = tf.nn.relu(tf.nn.bias_add(kernel2, bias2))
# 與上一層不同,先進行LRN處理,在進行最大池化層。
norm2 = tf.nn.lrn(conv2, 4, bias = 1.0, alpha = 0.001/9.0, beta = 0.75)
pool2 = tf.nn.max_pool(norm2, ksize = [1,3,3,1], strides = [1,2,2,1], padding = 'SAME')
# 全連線層
# 將上一層的輸出結果進行flatten。tf.reshape函式將每個樣本都變成一維向量。
reshape = tf.reshape(pool2, [batch_size, -1])
# 獲取資料扁平化之後的長度。
dim = reshape.get_shape()[1].value
# 對全連線層的weight進行初始化,隱含節點數為384,正太分佈的標準差0.04。設定非零的weight loss,這一程所有引數被L2正則約束。
weight3 = variable_with_weight_loss(shape = [dim, 384], stddev = 0.04, wl = 0.004)
# bias值初始化為0.1
bias3 = tf.Variable(tf.constant(0.1, shape = [384]))
# 使用啟用函式進行非線性化
local3 = tf.nn.relu(tf.matmul(reshape, weight3) + bias3)
# 全連線層(與上一層類似)
# 隱含層節點數下降一半隻有192個,其他超引數保持不變
weight4 = variable_with_weight_loss(shape = [384,192], stddev = 0.04, wl = 0.004)
bias4 = tf.Variable(tf.constant(0.1, shape = [192]))
local4 = tf.nn.relu(tf.matmul(local3, weight4) + bias4)
# 輸出層(把Softmax的操作放在了loss部分)
# 建立weight,其正態分佈標準差為上一層隱含節點的倒數,並且不計入L2的正則。
weight5 = variable_with_weight_loss(shape = [192,10], stddev = 1/192.0, wl = 0.0)
bias5 = tf.Variable(tf.constant(0.0, shape = [10]))
# Softmax放在下面的原因。我們不需要對inference的輸出進行softmax處理就可以獲得最終的分類結果。
# 直接比較inference輸出的各類的數值大小即可。計算softmax主要是為了計算loss。因此softmax操作整合到後面合適。
# 模型Inference的輸出結果
logits = tf.nn.relu(tf.matmul(local4, weight5) + bias5)
########計算CNN的loss########
# softmax和cross entropy loss的計算合在一起
# 得到最終的loss,其中包括cross entropy loss和後兩個全連線層weight的L2 loss
def loss(logits, labels):
labels = tf.cast(labels, tf.int64)
cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(logits = logits, labels = labels, name = 'cross_entropy_per_example')
cross_entropy_mean = tf.reduce_mean(cross_entropy, name = 'cross_entropy')
tf.add_to_collection('losses', cross_entropy_mean)
return tf.add_n(tf.get_collection('losses'), name = 'total_loss')
# loss函式中傳入值,獲得最終的loss
loss = loss(logits, label_holder)
########訓練設定 ########
# 選擇優化器,學習速率設為1e-3
train_op = tf.train.AdamOptimizer(1e-3).minimize(loss)
# 輸出結果中top k的準確率,也就是輸出分數最高的那一類的準確率
top_k_op = tf.nn.in_top_k(logits, label_holder, 1)
# 建立預設的Session
sess = tf.InteractiveSession()
# 初始化全部模型引數
tf.global_variables_initializer().run()
# 啟動圖片資料增強的執行緒佇列,一共使用16個執行緒進行加速。不啟動無法開始後面的inference
tf.train.start_queue_runners()
########開始訓練########
# 記錄每個step花費的時間,每隔10個step計算並展示當前的loss、每秒能訓練的樣本數量,以及在一個batch花費的時間。
for step in range(max_steps):
start_time = time.time()
# 在每一個step的訓練過程,先獲得一個batch資料。再將這個batch資料傳入train_op和loss的計算。
image_batch, label_batch = sess.run([images_train, labels_train])
_, loss_value = sess.run([train_op, loss],
feed_dict = {image_holder: image_batch, label_holder: label_batch})
duration = time.time() - start_time
if step %10 ==0:
examples_per_sec = batch_size / duration
sec_per_batch = float(duration)
format_str = ('step %d,loss=%.2f (%.1f example/sec; %.3f sec/batch)')
print(format_str % (step, loss_value, examples_per_sec, sec_per_batch))
# 測試集評測準確率
# 測試集樣本數
num_examples = 10000
import math
# 計算多少個batch能將全部樣本評測完
num_iter = int(math.ceil(num_examples / batch_size))
true_count = 0
total_sample_count = num_iter * batch_size
step = 0
# 在每一個的step中使用Session的run方法獲取test的batch
# 再執行top_k_op計算模型在這個batch的top 1上預測正確的樣本數。
# 最後彙總所有預測正確的結果,求得全部測試樣本中預測正確的數量。
while step < num_iter:
image_batch, label_batch = sess.run([images_test,labels_test])
predictions = sess.run([top_k_op], feed_dict = {image_holder: image_batch, label_holder: label_batch})
true_count += np.sum(predictions)
step += 1
# 最後將準確率評測結果計算並打印出來。
precision = true_count / total_sample_count
# print('precision @ 1 = %.3f' % precision)
print (' Num examples: %d Num correct: %d Precision @ 1: %0.02f ' % (
total_sample_count, true_count, precision))
相關推薦
TensorFlow實現卷積神經網路(進階)
此模型中如果使用100k個batch,並結合學習速率的decay(即每隔一段時間將學習速率下降一個比率),正確率可以高達86%。模型中需要訓練的引數約為100萬個,而預測時需要進行的四則運算總量在2000萬次左右。所以這個卷積神經網路模型中,使用一些技巧。 (
TensorFlow學習筆記(5)--實現卷積神經網路(MNIST資料集)
這裡使用TensorFlow實現一個簡單的卷積神經網路,使用的是MNIST資料集。網路結構為:資料輸入層–卷積層1–池化層1–卷積層2–池化層2–全連線層1–全連線層2(輸出層),這是一個簡單但非常有代表性的卷積神經網路。 import tensorflow
機器學習實驗(四):用tensorflow實現卷積神經網路識別人類活動
在近幾年,越來越多的使用者在智慧手機上安裝加速度感測器等一些裝置,這就為做一些應用需要收集相關的資料提供了方便。人類活動識別(human activity recognition (HAR))是其中的一個應用。對於HAR,有很多的方法可以去嘗試,方法的performance很大程度上依賴於特徵工程。傳統的機
TensorFlow學習筆記(7)--實現卷積神經網路(同(5),不同的程式風格)
import tensorflow as tf import numpy as np import input_data mnist = input_data.read_data_sets('data/', one_hot=True) print("MNIST
字元型圖片驗證碼,使用tensorflow實現卷積神經網路,進行驗證碼識別CNN
本專案使用卷積神經網路識別字符型圖片驗證碼,其基於 TensorFlow 框架。它封裝了非常通用的校驗、訓練、驗證、識別和呼叫 API,極大地減低了識別字符型驗證碼花費的時間和精力。 專案地址: https://github.com/nickliqian/cnn_captcha
Tensorflow實現卷積神經網路
如果不明白什麼是卷積神經網路,請參考:計算機視覺與卷積神經網路 下面基於開源的實現簡單梳理如何用tensorflow實現卷積神經網路. 實現卷積神經網路 載入資料集 # 載入資料集 impor
機器學習筆記:tensorflow實現卷積神經網路經典案例--識別手寫數字
從識別手寫數字的案例開始認識神經網路,並瞭解如何在tensorflow中一步步建立卷積神經網路。 安裝tensorflow 資料來源 kaggle新手入門的數字識別案例,包含手寫0-9的灰度值影象的csv檔案,下載地址:https://www.
深度學習筆記5-tensorflow實現卷積神經網路
深度學習筆記5-tensorflow實現卷積神經網路 在股票等預測模型中,可以從原始資料提取金融因子等特徵。而影象則無有效特徵,只能藉助SIFT、HOG等提取有效特徵,再集合SVM等機器學習演算法進行影象識別。卷積神經網路(CNN)提取的特徵則可以達到更好的效果,同時它不需要將特徵提取和
【Deep Learning】tensorflow實現卷積神經網路(AlexNet)
一、實驗要求 1.使用卷積神經網路實現圖片分類,資料集為OxFlowers17; 二、實驗環境 Anaconda2-4.3.1(Python2.7),tensorflow-cpu。 三、實驗原理 3.1 資料讀取 已知資料集
Tensorflow實現卷積神經網路,用於人臉關鍵點識別
今年來人工智慧的概念越來越火,AlphaGo以4:1擊敗李世石更是起到推波助瀾的作用。作為一個開挖掘機的菜鳥,深深感到不學習一下deep learning早晚要被淘汰。 既然要開始學,當然是搭一個深度神經網路跑幾個資料集感受一下作為入門最直觀了。自己寫程式碼實
利用TensorFlow實現卷積神經網路做文字分類
這篇部落格是翻譯Denny Britz寫的使用卷積神經網路做文字分類並且在Tensorflow上面實現,作者已經授權翻譯,這是原文。 在這篇部落格中,我們將實現一個類似於 Kim Yoon 論文中用於句子分類的卷積神經網路模型。論文中的模型在一系列文字分類任務(如情感分類)中獲得了良好的分類效能,併成為新文字
基於深度卷積神經網路(D-CNN)的影象去噪方法
基於深度卷積神經網路的影象去噪方法 摘要:影象去噪在影象處理中仍然是一個具有挑戰性的問題。作者提出了一種基於深度卷積神經網路(DCNN)的影象去噪方法。作者設計的不同於其他基於學習的方法:一個DCNN來實現噪聲影象。因此,通過從汙染影象中分離噪聲影
你的計算機也可以看懂世界——十分鐘跑起卷積神經網路(Windows+CPU)
眾所周知,如果你想研究Deep Learning,那麼比較常用的配置是Linux+GPU,不過現在很多非計算機專業的同學有時也會想採用Deep Learning方法來完成一些工作,那麼Linux+GPU的環境就有可能會給他們帶來一定困擾,我寫這篇文章就是為了讓這些同學可以不用去裝Linux系統,不用去涉及GP
深度學習與卷積神經網路(直觀理解)
基本上在輸入影象中,如果有一個形狀是類似於這種濾波器的代表曲線,那麼所有的乘積累加在一起會導致較大的值!現在讓我們看看當我們移動我們的過濾器時會發生什麼。可以看到結果值是0哦,為什麼?還不明白麼,因為耳朵的邊緣和剛剛尾股部曲線太不同了。 這樣的多個濾波器就可以在大量資料的訓練下得到大量特徵了
tensorflow 學習專欄(六):使用卷積神經網路(CNN)在mnist資料集上實現分類
卷積神經網路(Convolutional Neural Network, CNN)是一種前饋神經網路,它的人工神經元可以響應一部分覆蓋範圍內的周圍單元,對於大型影象處理有出色表現。卷積神經網路CNN的結構一般包含這幾個層:輸入層:用於資料的輸入卷積層:使用卷積核進行特徵提取和
TensorFlow實現用於影象分類的卷積神經網路(程式碼詳細註釋)
這裡我們採用cifar10作為我們的實驗資料庫。 首先下載TensorFlow Models庫,以便使用其中提供的CIFAR-10資料的類。 git clone https://github.com/tensorflow/models.git cd mo
TensorFlow的layer層搭建卷積神經網路(CNN),實現手寫體數字識別
目前正在學習使用TensorFlow,看到TensorFlow官方API上有一個呼叫layer層來搭建卷積神經網路(CNN)的例子,和我們之前呼叫的nn層的搭建卷積神經網路稍微有點不同。感覺layer層封裝性更強,直接輸入引數就可以是實現。程式碼如下:#-*- codi
機器學習筆記(十三):TensorFlow實戰五(經典卷積神經網路: LeNet -5 )
1 - 引言 之前我們介紹了一下卷積神經網路的基本結構——卷積層和池化層。通過這兩個結構我們可以任意的構建各種各樣的卷積神經網路模型,不同結構的網路模型也有不同的效果。但是怎樣的神經網路模型具有比較好的效果呢? 下圖展示了CNN的發展歷程。 經過人們不斷的嘗試,誕生了許多有
利用Python實現卷積神經網路的視覺化(附Python程式碼)
對於深度學習這種端到端模型來說,如何說明和理解其中的訓練過程是大多數研究者關注熱點之一,這個問題對於那種高風險行業顯得尤為重視,比如醫療、軍事等。在深度學習中,這個問題被稱作“黑匣子(Black Box)”。如果不能解釋模型的工作過程,我們怎麼能夠就輕易相信模型的輸出結果呢? 以深度學習模型檢測
TensorFlow實戰:Chapter-4(CNN-2-經典卷積神經網路(AlexNet、VGGNet))
引言 AlexNet AlexNet 簡介 AlexNet的特點 AlexNet論文分析 引言