1. 程式人生 > >TensorFlow入門-Inception(v3)影象識別

TensorFlow入門-Inception(v3)影象識別

Inception-v3是最新的一個模型,在ImageNet-2012上訓練進行分類。

與其他網路對比

AlexNet achieved by setting a top-5 error rate of 15.3% on the 2012 validation data set; BN-Inception-v2 achieved 6.66%; Inception-v3 reaches 3.46%.

How well do humans do on ImageNet Challenge? There’s a blog post by Andrej Karpathy who attempted to measure his own performance. He reached 5.1%

top-5 error rate.

我猜人類的識別率應該很大程度受限於一個人的知識水平。比如對於貓而言,我們只知道很少幾個品種,而計算機卻可以儲存很多品種的貓的資訊。

呼叫Python API

在cmd中輸入

cd tensorflow/models/image/imagenet
python classify_image.py

自動在官網下載訓練好的Inception-v3模型,和相關檔案(一張測試影象cropped_panda.jpg)


這裡寫圖片描述

Inception-v3自動分類此影象,結果為

giant panda, panda, panda bear, coon bear, Ailuropoda melanoleuca (score = 0.88493)
indri, indris, Indri indri, Indri brevicaudatus (score = 0.00878)
lesser panda, red panda, panda, bear cat, cat bear, Ailurus fulgens (score = 0.00317)
custard apple (score = 0.00149)
earthstar (score = 0.00127)

測試自定義影象,使用–image_file引數

python classify_iamge.py –image_file=img_dir

比如
1.


這裡寫圖片描述

convertible (score = 0.52526)敞篷車
sports car, sport car (score = 0.34500)跑車
grille, radiator grille (score = 0.01084)
car wheel (score = 0.00232)
amphibian, amphibious vehicle (score = 0.00137)
前兩者置信度都挺高,30%+,那更合理的結果是不是敞篷跑車?
2.


這裡寫圖片描述

Egyptian cat (score = 0.14357)埃及貓
tabby, tabby cat (score = 0.07122)
tiger cat (score = 0.06887)
Persian cat (score = 0.02849)
window screen (score = 0.02827)
An exception has occurred, use %tb to see the full traceback.
頭一次聽說埃及貓:)
3.


這裡寫圖片描述

comic book (score = 0.11628)動漫書
coffee mug (score = 0.03781)
cup (score = 0.02944)
shower curtain (score = 0.02505)
desktop computer (score = 0.02169)

如果問一個人,這是什麼,大多數回答是一隻貓吧。結果是comic book,看來影象風格(style)對CNN結果有很大影響。
4.


這裡寫圖片描述

German shepherd, German shepherd dog, German police dog, alsatian (score = 0.95344)德國牧羊犬
malinois (score = 0.00227)
bulletproof vest (score = 0.00115)
bloodhound, sleuthhound (score = 0.00110)
muzzle (score = 0.00071)
經典的樣本!
5.


這裡寫圖片描述

chow, chow chow (score = 0.82244) 中華田園犬
tabby, tabby cat (score = 0.01480)虎紋貓
Eskimo dog, husky (score = 0.00772)
dingo, warrigal, warragal, Canis dingo (score = 0.00715)
American Staffordshire terrier, Staffordshire terrier, American pit bull terrier, pit bull terrier (score = 0.00627)
多個目標的情況,top-1更關注較大的dog?但是top-2的預測表明cat的存在。
6.


這裡寫圖片描述

gown (score = 0.11101)女禮服,長袍,睡衣
picket fence, paling (score = 0.10401)圍欄
hoopskirt, crinoline (score = 0.10057)裙子
maypole (score = 0.07265)
overskirt (score = 0.06151)

為什麼答案不是一個漂亮的小女孩,而是長裙子,關注點果然不一樣!

相關推薦

TensorFlow入門-Inception(v3)影象識別

Inception-v3是最新的一個模型,在ImageNet-2012上訓練進行分類。 與其他網路對比 AlexNet achieved by setting a top-5 error rate of 15.3% on the 2012 validat

Tensorflow— 使用inception-v3做各種影象識別

程式碼:import tensorflow as tf import os import numpy as np import re from PIL import Image import matplotlib.pyplot as plt程式碼:class NodeLook

機器學習筆記(十二):TensorFlow實戰四(影象識別與卷積神經網路)

1 - 卷積神經網路常用結構 1.1 - 卷積層 我們先來介紹卷積層的結構以及其前向傳播的演算法。 一個卷積層模組,包含以下幾個子模組: 使用0擴充邊界(padding) 卷積視窗過濾器(filter) 前向卷積 反向卷積(可選) 1.1

tensorflow利用Inception-v3實現遷移學習

1、Tensorflow 實現遷移學習。 #photo地址: #http://download.tensorflow.org/example_images/flower_photos.tgz #Inception-v3模型 #https://storage.googleapi

機器學習筆記(十二):TensorFlow實現四(影象識別與卷積神經網路)

1 - 卷積神經網路常用結構 1.1 - 卷積層 我們先來介紹卷積層的結構以及其前向傳播的演算法。 一個卷積層模組,包含以下幾個子模組: 使用0擴充邊界(padding) 卷積視窗過濾器(filter) 前向卷積 反向卷積(可選) 1.1.2 - 邊界填充

[AI教程]TensorFlow入門:手勢數字識別

實驗說明 本實驗為吳恩達課後程式設計作業第二課第三週內容,通過引導我們將完成一個深度學習框架,使我們可以更輕鬆地構建神經網路。程式設計框架不僅可以縮短編碼時間,而且有時還可以執行加速程式碼的優化。 資料集下載地址:[https://github.com/stor

tensorflow實現 Inception V3

架構 輸入影象尺寸: 299x299x3 卷積1: 3x3/2 輸入影象尺寸: 149x149x32 卷積2: 3x3/1 輸入影象尺寸: 147x147x32 卷積3: 3x3/1 輸入影象尺寸: 147x147x64 池化1: 3x3/2

深度學習框架Tensorflow學習與應用(八 儲存和載入模型,使用Google的影象識別網路inception-v3進行影象識別)

一 模型的儲存 [email protected]:~/tensorflow$ cat 8-1saver_save.py # coding: utf-8 # In[1]: import tensorflow as tf from tensorflow.examples.tutorials

TensorFlow影象識別(物體分類)入門教程

本文主要介紹瞭如何使用TensorFlow環境執行一個最基本的影象分類器(Win10系統)。原始碼地址https://github.com/sourcedexter/tfClassifier/tree/master/image_classification (這個大神好像改名

利用Inception-v3現成權重進行特徵提取(影象識別

在tensorflow官網的影象識別的中文介紹中,介紹瞭如何用Tensorflow的模型程式碼庫中的classify_image.py進行影象識別。裡面有介紹如何測試,而且還提供了最後一層的1*1*2048維的特徵提取方式,所以在這裡介紹一下。 ...... with tf.Session

Tensorflow 卷積神經網路 Inception-v3模型 遷移學習 花朵識別

 Inception-v3模型結構:Inception-v3簡介:1.基於大濾波器尺寸分解卷積在視覺網路中,預期相近啟用的輸出是高度相關的。因此,我們可以預期,它們的啟用可以在聚合之前被減少,並且這應該會導致類似的富有表現力的區域性表示。全卷積網路 減少計算可以提高效率2.分

Tensorflow學習筆記--使用遷移學習做自己的影象分類器(Inception v3

本文主要使用inception v3的模型,再後面接一個softmax,做一個分類器。具體程式碼都是參照tf github。 整體步驟: 步驟一:資料準備,準備自己要分類的圖片訓練樣本。 步驟二:retrain.py 程式,用於下載inception v3模型及訓練後面的

運用java 呼叫tensorflow中的inception v3模型

首先使用maven新增依賴項: <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3

Python使用tensorflow實現影象識別(貓狗大戰)-01

Python使用tensorflow實現影象識別(貓狗大戰)-01 import_data.py import tensorflow as tf import numpy as np import os #引入tensorflow、numpy、os 三個第三方模組 img_widt

TensorFlow入門之二:tensorflow手寫數字識別

一、基礎知識 基礎知識可以跳過,可以直接看後面的程式碼實現 MNIST資料集 MNIST資料集的官網是Yann LeCun’s website。可以使用下面的python程式碼自動下載資料集。 #已經下載input_data.py #import input_data #沒有

tensorflow入門案例詳解——MNIST神經網路識別

1. MNIST下載去官網http://yann.lecun.com/exdb/mnist/ 下載4個檔案:訓練影象集/訓練標籤集/測試影象集/測試標籤集在tensorflow example mnist的目錄下面新建MNIST_data資料夾,然後把下載的4個MNIST資料集複製進去。例如我電

21個專案玩轉深度學習:基於TensorFlow的實踐詳解03—打造自己的影象識別模型

書籍原始碼:https://github.com/hzy46/Deep-Learning-21-Examples CNN的發展已經很多了,ImageNet引發的一系列方法,LeNet,GoogLeNet,VGGNet,ResNet每個方法都有很多版本的衍生,tensorflow中帶有封裝好各方法和網路的函式

深度學習、影象識別入門,從VGG16卷積神經網路開始

剛開始接觸深度學習、卷積神經網路的時候非常懵逼,不知道從何入手,我覺得應該有一個進階的過程,也就是說,理應有一些基本概念作為奠基石,讓你有底氣去完全理解一個龐大的卷積神經網路: 本文思路: 一、我認為學習卷積神經網路必須知道的幾個概念: 1、卷積過程: 我們經常說卷積神經網路卷積神經網路,到

Tensorflow入門教程之手寫數字MINST識別

Tensorflow入門教程之手寫數字MINST識別 MNIST是在機器學習領域中的一個經典問題。該問題解決的是把28x28畫素的灰度手寫數字圖片識別為相應的數字,其中數字的範圍從0到9. MNIST 資料下載 Yann LeCun's MNIST page也提供了訓練集與測試集資料

TensorFlow:實戰Google深度學習框架》——6.1 影象識別中經典資料集介紹

1、CIFAR資料集 CIFAR是一個影響力很大的影象分類資料集,CIFAR資料集中的圖片為32*32的彩色圖片,由Alex  Krizhevsky教授、Vinod Nair博士和Geoffrey Hinton教授整理的。 CIFAR是影象詞典專案(Visual Dictionar