從零開始學caffe（七）：利用GoogleNet實現影象識別

阿新 • • 發佈：2018-12-17

一、準備模型

在這裡，我們利用已經訓練好的Googlenet進行物體影象的識別，進入Googlenet的GitHub地址，進入models資料夾，選擇Googlenet 在這裡插入圖片描述點選Googlenet的模型下載地址下載該模型到電腦中。

模型結構

在這裡，我們利用之前講到的網路模型繪製網站畫出Googlenet的結構圖如下：在這裡插入圖片描述

在這裡，pad就是給影象補零，pad:2就是補兩圈零的意思；
LRN就是區域性相應歸一化，利用LRN可以提高模型識別的準確率；
Inception結構中，不同大小的卷積核意味著不同大小的感受野，最後的合併意味著不同尺度特徵的融合。採用1,3,5為卷積核的大小，是因為使用步長為1，pad=0,1,2的方式取樣之後得到的特徵平面大小相同；
concat層用來合併資料，在這裡合併的條件是資料的後三個引數要相同，所以在前面的inception結構中，我們使用了不同的卷積核大小和pad。

準備圖片

在這裡，我們找幾張任意圖片，然後放入Googlenet的資料夾下,，作為待識別的圖片。在這裡插入圖片描述

準備synset_words.txt檔案

synset_words.txt是用來將物體的類別序號進行對應的檔案，在識別過程中，我們先是得到序號，然後根據這個序號找到對應的物體種類。

使用python介面呼叫GoogleNet實現影象識別

在這裡，我們用jupyter開啟Googlenet.影象識別.ipynb檔案,這裡部分程式碼如下：

import 
 caffe
import numpy as np
import matplotlib.pyplot as plt
import os
import PIL
from PIL import Image
import sys

#定義Caffe根目錄
caffe_root = 'E:/caffe-windows/'
#網路結構描述檔案
deploy_file = caffe_root+'models/bvlc_googlenet/deploy.prototxt'
#訓練好的模型
model_file = caffe_root+'models/bvlc_googlenet/bvlc_googlenet.caffemodel' 


#cpu模式
caffe.set_mode_cpu()

#定義網路模型
net = caffe.Classifier(deploy_file, #呼叫deploy檔案
                       model_file,  #呼叫模型檔案
                       mean=np.load(caffe_root +'python/caffe/imagenet/ilsvrc_2012_mean.npy').mean(1).mean(1), #呼叫均值檔案
                       channel_swap=(2,1,0),  #caffe中圖片是BGR格式，而原始格式是RGB，所以要轉化
                       raw_scale=255,         #python中將圖片儲存為[0, 1]，而caffe中將圖片儲存為[0, 255]，所以需要一個轉換
                       image_dims=(224, 224)) #輸入模型的圖片要是224*224的圖片

#分類標籤檔案
imagenet_labels_filename = caffe_root +'models/bvlc_googlenet/synset_words.txt'
#載入分類標籤檔案
labels = np.loadtxt(imagenet_labels_filename, str, delimiter='\t')

#對目標路徑中的影象，遍歷並分類
for root,dirs,files in os.walk(caffe_root+'models/bvlc_googlenet/image/'):
    for file in files:
        #載入要分類的圖片
        image_file = os.path.join(root,file)
        input_image = caffe.io.load_image(image_file)

        #列印圖片路徑及名稱
        image_path = os.path.join(root,file)
        print(image_path)
        
        #顯示圖片
        img=Image.open(image_path)
        plt.imshow(img)
        plt.axis('off')
        plt.show()
        
        #預測圖片類別
        prediction = net.predict([input_image])
        print 'predicted class:',prediction[0].argmax()

        # 輸出概率最大的前5個預測結果
        top_k = prediction[0].argsort()[-5:][::-1]
        for node_id in top_k:     
            #獲取分類名稱
            human_string = labels[node_id]
            #獲取該分類的置信度
            score = prediction[0][node_id]
            print('%s (score = %.5f)' % (human_string, score))

執行上述程式碼即可輸出對物體種類的預測概率在這裡插入圖片描述最終得到的預測結果是根據可能性大小列出五個種類

從零開始學caffe（七）：利用GoogleNet實現影象識別

一、準備模型在這裡，我們利用已經訓練好的Googlenet進行物體影象的識別，進入Googlenet的GitHub地址，進入models資料夾，選擇Googlenet 點選Googlenet的模型下載地址下載該模型到電腦中。模型結構在這裡，我們利用之前講

從零開始學caffe（四）：mnist手寫數字識別網路結構模型和超引數檔案的原始碼閱讀

下面為網路結構模型 %網路結構模型 name: "LeNet" #網路的名字"LeNet" layer { #定義一個層 name: "mnist" #層的名字"mnist" type:

從零開始學caffe（十）：caffe中snashop的使用

在caffe的訓練期間，我們有時候會遇到一些不可控的以外導致訓練停止（如停電、裝置故障燈），我們就不得不重新開始訓練，這對於一些大型專案而言是非常致命的。在這裡，我們介紹一些caffe中的snashop。利用snashop我們就可以實現訓練的繼續進行。在之前我們訓練得到的檔案中，我們發現

從零開始學caffe（九）：在Windows下實現影象識別

本系列文章主要介紹了在win10系統下caffe的安裝編譯，運用CPU和GPU完成簡單的小專案，文章之間具有一定延續性。 step1:準備資料集資料集是進行深度學習的第一步，在這裡我們從以下五個連結中下載所需要的資料集： animal flower plane hou

從零開始學caffe（八）：Caffe在Windows環境下GPU版本的安裝

之前我們已經安裝過caffe的CPU版本，但是在MNIST手寫數字識別中，我們發現caffe的CPU版本執行速度較慢，訓練效率不高。因此，在這裡我們安裝了caffe的GPU版本，並使用GPU版本的caffe同樣對手寫MNIST數字集進行訓練。 step1: 安裝CUDA

從零開始學caffe（二）：caffe在win10下的安裝編譯

環境要求作業系統：64位windows10 編譯環境：Visual Studio 2013 Ultimate版本安裝流程 step1：檔案的下載從GitHub新增連結描述中下載Windows版本的caffe，並進行解壓到電腦中。 step2:檔案修改將壓縮包

從零開始學USB（七、端點、管道、介面、配置、裝置）

端點（endpoint）：端點是USB裝置的唯一可識別部分，其是主機和裝置之間的通訊流的終點。它是一個USB裝置或主機上的一個數據緩衝區，用來存放和傳送USB的各種資料。每個USB邏輯裝置由一組獨立的端點組成。每個邏輯裝置都有一個由系統在裝置連線時分配的唯一地址。裝置上的每個端點在設計時都會得到

從零開始學HTTP （二） HTTP結構與基礎

現象 encode 伸縮協議 for 服務端例如 lis 格式 HTTP結構與基礎這篇文章中，我們主要針對HTTP\1.1版本進行介紹請求報文和響應報文請求報文請求報文由客戶端發出，其格式為：請求方法請求URI 協議版本可選的請求首部字段和內容實體，

從零開始學演算法（四）歸併排序

從零開始學演算法（四）歸併排序歸併排序演算法介紹演算法原理演算法簡單記憶說明演算法複雜度和穩定性程式碼實現歸併排序程式碼是Javascript語言寫的（幾乎是虛擬碼）演算

從零開始學演算法（三）插入排序

從零開始學演算法（三）插入排序插入排序演算法介紹演算法原理演算法簡單記憶說明演算法複雜度和穩定性程式碼實現插入排序程式碼是Javascript語言寫的（幾乎是虛擬碼）演算

從零開始學演算法（二）選擇排序

從零開始學演算法（二）選擇排序選擇排序演算法介紹演算法原理演算法簡單記憶說明演算法複雜度和穩定性程式碼實現選擇排序程式碼是Javascript語言寫的（幾乎是虛擬碼）演算

從零開始學演算法（一）氣泡排序

從零開始學演算法（一）氣泡排序氣泡排序演算法介紹演算法原理演算法簡單記憶說明演算法複雜度和穩定性程式碼實現氣泡排序因為在學前端，程式碼是Javascript語言寫的演算法

微信小程式從零開始開發步驟（七）引入外部js 檔案

上一章講到小程式頁面的四種常見的跳轉的方法，這一章寫如何引入一個外部的js檔案，既utils資料夾的用處，其實步驟很簡單：1：準備好外部想要引入的外部檔案，命名為util.js,並且填充固定的檔案內容（一般是固定的庫）圖片.png2：開啟util.js ，繼續填寫重要內容將要使用的方法

從零開始學WCF（14）WCF安全性概述

安全性概述常見的安全威脅： 1）觀測網路流量以獲取敏感資訊。以線上銀行為列，某個客戶端請求將資金從一個賬戶轉賬到另一個賬戶。一個惡意使用者截獲了此訊息（具有賬號和密碼），隨後從盜用的賬戶將資金轉出。 2）欺詐性實體在客戶端未發覺的情況下其服務的作用。在此情況下，惡意使

從零開始學mysql（一）

自從用雲筆記，已經很少來了 ·· 以前接觸過mysql，但最多的時候還是使用Oracle，現在正好剛剛離職，有時間來學習一下，對於以前接觸過的mysql，只是簡單的查查而已。先看官網文件吧，一點點來吧，不怕走錯路，就怕一步不走。版本：MySQL 5.7

從零開始學django（一）

一、web應用、http協議、web框架閱讀目錄一 Web應用程式是什麼二基於SOCKET寫一個web應用一、web應用、http協議、web框架一 Web應用程式是什麼 Web應用程式是一種可以通過Web訪

Java 從零開始學爬蟲（gecco）

廢話：第一次學習並嘗試分析、爬取一個網站的資料，全部是從零開始的經驗，希望對各位看官有幫助，當然，本次爬取的是一個比較簡單的網頁，沒有任何反爬蟲措施的網頁。網上查了一下Java爬資料，最原始的方式是用請求網頁的字串然後用正則解析標籤，再查了一下有什麼爬蟲、解析

從零開始學Linux（一）

Linux 基本命令：遍歷目錄：在 Linux 檔案系統上，可以使用切換目錄命令 cd 將 shell 會話切換到另一個目錄：格式：cd destination cd 命令可以接受單個引數；如果沒有引數，則將切換到使用者主目錄。 destination 引數可以用倆種方式表示：

從零開始學Vue（一）—— Vue.js 入門

應該特性簡體經驗了解 lte 工程目錄節點 times 概述 vue.js作為現在筆記熱門的JS框架，使用比較簡單易上手，也成為很多公司首選的JS框架。但是對於初學者可能學起來有些麻煩，所以推出《從零開始學Vue》系列博客，本系列計劃推出19篇博客文章，這是最簡

從零開始學Snaker（一）- 官方專案執行

ps: 架構師交流群(QQ群號 304287620) snaker，是一款非常輕量級的國產工作流框架，這就好比許可權控制框架spring security與shiro，前者是spring大廠，除了security外提供其他非常強大的框架，而shiro就相當簡單，學習成本

從零開始學caffe（七）：利用GoogleNet實現影象識別

一、準備模型

模型結構

準備圖片

準備synset_words.txt檔案

使用python介面呼叫GoogleNet實現影象識別

相關推薦