基於 TensorFlow 的影象識別（R實現）

阿新 • • 發佈：2019-01-11

提到機器學習，深度學習這些，大家都會立馬想起Python。但R的實力也不容小覷。今天就用R來演示一個基於TensorFlow的影象識別的例子。如果你想執行這些程式碼，就必須先安裝配置好TensorFlow，我是在Linux系統上面執行的。如何配置TensorFlow儘量看看官方文件，雖然是英文的，但是最新的，也是最準確的。

廢話不說，直接來看程式碼，在程式碼中我也做了詳細的註釋，看起來應該不是很困難。

library(tensorflow) #載入TensorFlow包

library(magrittr) #資料處理包，可以使用管道函式

slim= tf$contrib$slim #slim是一個使構建，訓練，評估神經網路變得簡單的庫。

# slim提供了很多計算機視覺方面的著名模型（VGG, AlexNet等），我們不僅可以直接使用，甚至能以各種方式進行擴充套件。

tf$reset_default_graph() #在每次執行中清除當前圖形，以避免變數重複#Session會話 張量的具體值和操作,會話關閉時，張量的任何具體值都會丟失

images = tf$placeholder(tf$float32, shape(NULL, NULL, NULL, 3))# 建立佔位符

imgs_scaled = tf$image$resize_images(images, shape(224,224)) #設定圖片大小# slim$conv2d自帶卷積功能+激勵函式 

fc8 = slim$conv2d(imgs_scaled, 64, shape(3,3), scope='vgg_16/conv1/conv1_1') %>% 
  slim$conv2d(64, shape(3,3), scope='vgg_16/conv1/conv1_2')  %>%
  slim$max_pool2d( shape(2, 2), scope='vgg_16/pool1')  %>% #池化操作

  slim$conv2d(128, shape(3,3), scope='vgg_16/conv2/conv2_1')  %>%
  slim$conv2d(128, shape(3,3), scope='vgg_16/conv2/conv2_2')  %>%
  slim$max_pool2d( shape(2, 2), scope='vgg_16/pool2')  %>%

  slim$conv2d(256, shape(3,3), scope='vgg_16/conv3/conv3_1')  %>%
  slim$conv2d(256, shape(3,3), scope='vgg_16/conv3/conv3_2')  %>%
  slim$conv2d(256, shape(3,3), scope='vgg_16/conv3/conv3_3')  %>%
  slim$max_pool2d(shape(2, 2), scope='vgg_16/pool3')  %>%

  slim$conv2d(512, shape(3,3), scope='vgg_16/conv4/conv4_1')  %>%
  slim$conv2d(512, shape(3,3), scope='vgg_16/conv4/conv4_2')  %>%
  slim$conv2d(512, shape(3,3), scope='vgg_16/conv4/conv4_3')  %>%
  slim$max_pool2d(shape(2, 2), scope='vgg_16/pool4')  %>%

  slim$conv2d(512, shape(3,3), scope='vgg_16/conv5/conv5_1')  %>%
  slim$conv2d(512, shape(3,3), scope='vgg_16/conv5/conv5_2')  %>%
  slim$conv2d(512, shape(3,3), scope='vgg_16/conv5/conv5_3')  %>%
  slim$max_pool2d(shape(2, 2), scope='vgg_16/pool5')  %>%

  slim$conv2d(4096, shape(7, 7), padding='VALID', scope='vgg_16/fc6')  %>%
  slim$conv2d(4096, shape(1, 1), scope='vgg_16/fc7') %>% 

  # Setting the activation_fn=NULL does not work, so we get a ReLU
  slim$conv2d(1000, shape(1, 1), scope='vgg_16/fc8')  %>%
  tf$squeeze(shape(1, 2), name='vgg_16/fc8/squeezed')

tf$summary$FileWriter('/tmp/dumm/vgg16', tf$get_default_graph())$close() #儲存在/tmp/dumm/vgg16目錄下

restorer = tf$train$Saver() #建立一個Saver 來管理模型中的所有變數。

sess = tf$Session()
restorer$restore(sess, 'vgg_16.ckpt') #復原模型

library(jpeg)
img1<-readJPEG('caomei.jpg') #img1的值在0-1之間。

d=dim(img1)  #獲取img1的維度
imgs =array(255*img1,dim = c(1,d[1],d[2],d[3]))
#因為數值需要在0到225之間，所以需要乘225.形成一個四維陣列#我們可以通過與儲存在陣列imgs中的影象的張量來對影象做預測

fc8_vals=sess$run(fc8,dict(images=imgs))#將fc8的張量儲存在fc8_vals中。
fc8_vals[1:5]

probs=exp(fc8_vals)/sum(exp(fc8_vals))

#按概率從高排序，並取前五個。
idx=sort.int(fc8_vals,index.return = TRUE,decreasing = TRUE)$ix[1:5]

#讀取影象分類檔案
library(readr)
names = read_delim("imagenet_classes.txt", "\t", escape_double = FALSE, trim_ws = TRUE,col_names = FALSE)
library(grid) #圖片處理的一個包，主要控制輸出圖形的大的外觀和一些細節東西的排列

g = rasterGrob(img1, interpolate=TRUE)  #圖形進行柵格化

text = ""for (id in idx) {
  text = paste0(text, names[id,][[1]], " ", round(probs[id],5), "\n") 
}

#annotate 新增文字註釋
#annotation_custom 可以新增各種圖形元素到ggplot圖中

library(ggplot2)
ggplot(data.frame(d=1:3)) + annotation_custom(g) + 
  annotate('text',x=0.05,y=0.05,label=text, size=7, hjust = 0, vjust=0, color='blue') + xlim(0,1) + ylim(0,1)

主要程式碼轉自：

https://randomthoughtsonr.blogspot.com/2016/11/image-classification-in-r-using-trained.html

我在網上找的了一張草莓的圖片，使用該模型進行識別。

識別結果如下圖，不過結果還挺準的。是草莓的概率是0.99999。不過有的情況下識別結果還是不太準的，畢竟這個模型也是有限的。

再來一張二哈（英文名：Siberian husky，取自百度百科）的照片，我專門在百度百科上面找了一張二哈比較霸氣的照片。在百度百科上面找的主要原因就是保證這張照片就是二哈。

圖片來自百度百科詞條“西伯利亞雪橇犬”

分析結果表明是二哈的可能性是0.592.基本上還是挺準的。

也許就有人說Siberian husky和husky，有什麼區別，百度百科上面他們好像就是一個。在維基百科查閱發現，Siberian husky是husky的一個品種，husky還包括了其他品種比如拉布拉多犬哈士奇，我相信一些愛狗人士可能會董。於是我在維基百科上面的husky詞條找到了下面這張照片。

圖片來源維基百科詞條“Husky”

結果顯示是husky的概率是0.46234.還是挺準的，畢竟這只是一張側臉照。把這兩張照片放在一塊，我覺得一般人都分不清楚。

補充：

由於TensorFlow發展比較快，如果看一些比較舊的資料，比如兩年前的資料，在用最新的TensorFlow時，輸入有的API就會報錯，我在這跟大家分享幾個API更新後的名字，希望在用的時候能幫到大家。

舊版本	新版本
tf.mul	tf.multiply
tf.sub	tf.subtract
tf.neg	tf.negative
tf.train.SummaryWriter	tf.summary.FileWriter

程式中用到的vgg16模型以及imagenet_classes.txt我已經通過百度網盤分享給大家了，在我的公眾號《跟著菜鳥一起學R語言》後臺回覆vgg16即可獲取下載連結。

注：

作者：王亨

公眾號：跟著菜鳥一起學R語言

基於 TensorFlow 的影象識別（R實現）

基於 TensorFlow 的影象識別（R實現）

TensorFlow影象識別（物體分類）入門教程

實戰 | 基於深度學習模型VGG的影象識別（附程式碼）

手把手的操作——用java呼叫科大訊飛的離線語音識別dll實現離線識別（JNA實現）（一）

手把手的操作——用java呼叫科大訊飛的離線語音識別dll實現離線識別（JNA實現）（二）

經典數字影象處理（matlab 實現）

簡單驗證碼的識別（matlab實現）

CNN人臉識別（python實現）

KNN演算法——實現手寫數字識別（Sklearn實現）

Python使用tensorflow實現影象識別（貓狗大戰）-01

Python使用tensorflow實現影象識別（貓狗大戰）-02

用101000張食物圖片實現影象識別（資料的獲取與處理）-python-tensorflow框架

opencv3實現簡單的數字影象識別（KNN）

從0到1：神經網路實現影象識別（中）

從0到1：神經網路實現影象識別（上）

基於OpenCV3實現人臉識別（原理篇）---PCA（Principal Component Analysis）

基於Retinex的影象去霧演算法（MATLAB實現）

基於畫素清晰度的影象融合演算法（Python實現）

利用python、tensorflow、opencv實現人臉識別（包會）！

影象處理例項--基於Hough變化的答題卡識別（未完成）

基於 TensorFlow 的影象識別（R實現）

相關推薦