以圖搜圖之模型篇：基於 InceptionV3 的模型 finetune

阿新 • • 發佈：2018-11-18

cte nec inpu 大神 rms mode cto num 創建

在以圖搜圖的過程中，需要以來模型提取特征，通過特征之間的歐式距離來找到相似的圖形。

本次我們主要講訴以圖搜圖模型創建的方法。

本文主要參考了這位大神的文章，傳送門在此： InceptionV3進行fine-tuning

訓練模型代碼如下：

# 基本流程
# 
import os
import sys
import glob
import argparse
import matplotlib.pyplot as plt

from keras.applications.inception_v3 import InceptionV3, preprocess_input
from keras.models import 
 Model
from keras.layers import Dense, GlobalAveragePooling2D
from keras.preprocessing.image import ImageDataGenerator
from keras.optimizers import SGD

# 一、定義函數
IM_WIDTH, IM_HEIGHT = 299, 299   # inceptionV3 指定圖片尺寸
FC_SIZE = 1024                   # 全連接層的數量

# 二、數據處理
# 圖片歸類放在不同文件夾下
train_dir = ‘E:/Project/Image/data/finetune/train 
‘  # 訓練集數據
val_dir = ‘E:/Project/Image/data/finetune/test‘ # 驗證集數據
nb_epoch = 1
batch_size = 15
nb_classes = len(glob.glob(train_dir + "/*"))  # 分類數


# 圖片增強
# ImageDataGenerator 會自動根據路徑下的文件夾創建標簽，所以在代碼中只看到輸入的 x, 看不到 y
train_datagen = ImageDataGenerator(
    preprocessing_function=preprocess_input,
    rotation_range 
=30,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True
)

train_generator = train_datagen.flow_from_directory(
    train_dir, target_size=(IM_WIDTH, IM_HEIGHT),batch_size=batch_size, class_mode=‘categorical‘
)

validation_generator = train_datagen.flow_from_directory(
    val_dir, target_size=(IM_WIDTH, IM_HEIGHT),batch_size=batch_size, class_mode=‘categorical‘
)

# 三、使用 bottleneck finetune
# 去掉 模型最外層的全連接層，添加上自己的 全連接層
# 添加新層函數
def add_new_last_layer(base_model, nb_classes):
    x = base_model.output
    x = GlobalAveragePooling2D()(x) # 下采樣
    x = Dense(FC_SIZE, activation=‘relu‘)(x)
    predict_bottle_feat = Dense(nb_classes, activation=‘softmax‘)(x)
    model = Model(input=base_model.input, output=predict_bottle_feat)
    return model

# 凍結 base_model 所有層
def setup_to_transfer_learn(model, base_model):
    for layer in base_model.layers:
        layer.trainable = False
    model.compile(optimizer=‘rmsprop‘, loss=‘categorical_crossentropy‘, metrics=[‘accuracy‘])

# 定義網絡框架
base_model = InceptionV3(weights=‘imagenet‘, include_top=False)
model = add_new_last_layer(base_model, nb_classes)
setup_to_transfer_learn(model, base_model)

# 訓練
# 模式一訓練
steps = 20 # 可以自由定義，越大結果越精準，但過大容易過擬合
history_tl = model.fit_generator(
  train_generator,
  epochs=nb_epoch,
  steps_per_epoch=steps,
  validation_data=validation_generator,
  validation_steps=steps,
  class_weight=‘auto‘)

# 保存模型
model.save("my_inceptionV3.h5")

View Code

使用模型提取指定層的特征：

from keras.preprocessing import image
from keras_applications.inception_v3 import preprocess_input
from keras.models import Model, load_model
import numpy as np

target_size = (229, 229) #fixed size for InceptionV3 architecture
base_model = load_model(filepath="my_inceptionV3.h5")

# 需要提取那一層的特征，此處就寫入指定層的名稱
model = Model(input=base_model.input, output=base_model.get_layer(‘block4_pool‘).output)

img_path = "C:/Users/Administrator/Pictures/搜圖/horse.jpg"
img = image.load_img(img_path, target_size=target_size)
x = image.img_to_array(img)
x = np.expand_dims(x, axis=0)
x = preprocess_input(x)

block4_pool_features = model.predict(x)

View Code

使用模型進行預測：

from keras.preprocessing import image
from  keras.models import load_model
import numpy as np
import json
from keras_applications.imagenet_utils import decode_predictions


def predict(model, img, target_size):
  """Run model prediction on image
  Args:
    model: keras model
    img: PIL format image
    target_size: (w,h) tuple
  Returns:
    list of predicted labels and their probabilities
  """
  if img.size != target_size:
    img = img.resize(target_size)

  x = image.img_to_array(img)
  x = np.expand_dims(x, axis=0)
  x = preprocess_input(x)
  preds = model.predict(x)   # 此處獲取的為
  return preds[0]            # 返回 numpy array [classes, ]

def decode_predict(probalities_list):
  with open("img_classes.json", ‘r‘) as load_f:
    load_dict = json.load(load_f)
  index = probalities_list.index(max(probalities_list))
  target_class = load_dict[str(index)]
  return target_class

target_size = (229, 229) #fixed size for InceptionV3 architecture
model = load_model(filepath="my_inceptionV3.h5")
img = image.load_img("C:/Users/Administrator/Pictures/搜圖/horse.jpg")

res_numpy = predict(model, img, target_size=target_size)
res_list = res_numpy.tolist()
target_class = decode_predict(res_list)
print(target_class)

View Code

以圖搜圖之模型篇：基於 InceptionV3 的模型 finetune

cte nec inpu 大神 rms mode cto num 創建在以圖搜圖的過程中，需要以來模型提取特征，通過特征之間的歐式距離來找到相似的圖形。本次我們主要講訴以圖搜圖模型創建的方法。本文主要參考了這位大神的文章，傳送門在此： InceptionV3進行fi

Elam的caffe筆記之配置篇：基於CentOS6.5 python3.6 CUDA8.0 cudnnv5.1 opencv3.1 下的caffe配置

Elam的caffe筆記之配置篇：基於CentOS6.5 python3.6 CUDA8.0 cudnnv5.1 opencv3.1 下的caffe配置作為一個完完全全的linux小白，平時連cmd開啟資料夾都要百度的人，面對單獨配置caffe這個棘手任務，第一反應就是搜教程。

DL之Attention-ED：基於TF NMT利用帶有Attention的 ED模型訓練、測試(中英文平行語料庫)實現將英文翻譯為中文的LSTM翻譯模型過程全記錄

DL之Attention-ED：基於TF NMT利用帶有Attention的 ED模型訓練(中英文平行語料庫)實現將英文翻譯為中文的LSTM翻譯模型過程全記錄測試輸出結果模型監控 1、SCALARS clipp

NLP之WE之Skip-Gram：基於TF利用Skip-Gram模型實現詞嵌入並進行視覺化、過程全記錄

NLP之WE之Skip-Gram：基於TF利用Skip-Gram模型實現詞嵌入並進行視覺化輸出結果程式碼設計思路程式碼執行過程全記錄 3081 originated -> 12 as 3081 originated

基於深度學習實現以圖搜圖功能

前記：深度學習的發展使得在此之前以機器學習為主流演算法的相關實現變得簡單，而且準確率更高，效果更好，在影象檢索這一塊兒，目前有谷歌的以圖搜圖，百度的以圖搜圖，而百度以圖搜圖的關鍵技術叫做“感知雜湊演算法”，這是一個很簡單且快速的演算法，其原理在於針對每一張圖片都生成一個特定的“指紋”，然後

自定義控制元件之繪圖篇：Canvas與圖層(二)

public class CLIP_TO_LAYER_SAVE_FLAG_VIEW extends View { private Paint mPaint; public CLIP_TO_LAYER_SAVE_FLAG_VIEW(Context context, Att

開發人員學Linux之終結篇：大型系統開發經驗談

bug 架構版本管理質量管控 1.前言這篇文章來源於我的一個ppt，而這個ppt是源於一個朋友的一次邀請，朋友邀請我為一個公司做一堂大約2小時的技術講座，我選定的方向是如何開發一個大型系統，在這裏我對大型系統的定義為日均PV在千萬級以上，而京東和淘寶這類則屬於巨型系統了。因此在本篇中

Linux賬號管理之第二篇：對用戶組進行管理

mov 切換屬於 tom blog 用戶組第二篇 roo clas 1、查看用戶的有效組群　　　　groups 用戶名註意：查看出來的結果可能有多個；第一個為主組群，後面的都是副組群　　 2、添加和刪除組群　　　　添加一個組：groupadd 組

真實感海洋的繪制（一）：基於統計學模型的水面模擬方法詳解

最簡自動生成 nbsp imu gif bubuko fourier div img 真實感海洋的繪制（一）：基於統計學模型的水面模擬方法詳解學習了基本的OpenGL和圖形學知識後，第一個想做的事情就是畫水（笑），因為對我而言各種遊戲裏面往往最令人印象深刻的就是那波光粼

Linux實戰第九篇：基於Centos6.9+7.4主備DNS服務器搭建實戰

服務器搭建 word uda notes centos6 fcc bfc data 閱讀個人筆記分享（在線閱讀）： http://note.youdao.com/noteshare?id=7898fa39596740bfcc9ca42ad643f045&sub=28A00

第三篇：基於深度學習的人臉特徵點檢測 - 資料集整理

https://yinguobing.com/facial-landmark-localization-by-deep-learning-data-collate/ 在上一篇博文中，我們已經下載到了包括300-W、LFPW、HELEN、AFW、IBUG和300-VW在內的6個數據集，初步估算有2

第五篇：基於深度學習的人臉特徵點檢測 - 生成TFRecord檔案

在上一篇博文中，我們已經獲取到了所有樣本的面部區域，並且對面部區域的有效性進行了驗證。當使用TensorFlow進行神經網路訓練時，涉及到的大量IO操作會成為訓練速度的瓶頸。為了加快訓練的速度，方便後期利用與復現，需要將所有用到的資料打包成為TFRecord檔案，一種TensorFlow原生支援的資

第二篇：基於深度學習的人臉特徵點檢測 - 資料與方法（轉載）

https://yinguobing.com/facial-landmark-localization-by-deep-learning-data-and-algorithm/ 在上一篇博文中，我們瞭解了人臉檢測與面部特徵點檢測的背景，並提到了當前技術方案存在特徵點位置不穩定的缺點，需要新的解決

第一篇：基於深度學習的人臉特徵點檢測 - 背景（轉載）

轉載自：https://yinguobing.com/facial-landmark-localization-by-deep-learning-background/ 人臉檢測與識別一直是機器學習領域的一大熱點。人臉檢測是指從影象中檢測出人臉區域。人臉識別則是判斷特定的臉部影象是否與某個人對應

讀書筆記 ---- 《深入理解Java虛擬機器》---- 第11篇：Java記憶體模型與執行緒

上一篇：晚期（執行期）優化：https://blog.csdn.net/pcwl1206/article/details/84642835 目錄： 1 概述 2 Java記憶體模型 2.1 主記憶體與工作記憶體 2.2

第二篇：基於梯度的學習

線性模型和神經網路模型的最大區別，在於神經網路的非線性導致大多數我們感興趣的代價函式都變得非凸。這意味著神經網路的訓練通常使用迭代的，基於梯度優化，僅僅使得代價函式達到一個非常小的值；而不是像訓練線性迴歸模型的線性方程求解器，活著用於訓練邏輯迴歸或SVM的凸優化演算法那樣可以

【搞定Java併發程式設計】第7篇：Java記憶體模型詳解

上一篇：ThreadLocal詳解：https://blog.csdn.net/pcwl1206/article/details/84859661 其實在Java虛擬機器的學習中，我們或多或少都已經接觸過了有關Java記憶體模型的相關概念（點選檢視），只不過在Java虛擬機器中講的不夠詳細，因此

NLP之情感分析：基於python程式設計(jieba庫)實現中文文字情感分析(得到的是情感評分)

NLP之情感分析：基於python程式設計(jieba庫)實現中文文字情感分析(得到的是情感評分) 輸出結果 1、測試物件 data1= '今天上海的天氣真好！我的心情非常高興！如果去旅遊的話我會非常興奮！和你一起去旅遊我會更加幸福！' data2= '今天上海天氣真差,非常討厭下雨,把

從壹開始前後端分離 [ vue + .netcore 補程 ] 三十一║ Nuxt終篇：基於Vuex的許可權驗證探究

緣起哈嘍大家好，今天週四啦，樓主明天要正式放假了，這裡先祝大家節日快樂咯，希望在家裡能繼續研究點兒東西吧，今天呢是 nuxt 的最後一篇，主要是對許可權登陸進行研究，這一塊咱們之前在說第一個專案的時候已經稍微說到了，具體的邏輯大家可以檢視這篇文章《二十四║ Vuex + JWT 實現授權驗證登陸》，具體的

Python 語言學習第四篇：動態型別模型

Python的變數不用宣告，賦值之後就可以直接使用，型別是在執行過程中自動確定的，這就是動態型別模型。該模型把變數和物件設計成兩個不同的實體，物件是儲存資料的地方，物件的型別是由初始值自動決定的，而變數僅僅是物件的引用。變數是通用的，同一個變數名可以引用任何型別的物件。一，變數、物件和引用動態型別模型

以圖搜圖之模型篇： 基於 InceptionV3 的模型 finetune

相關推薦

以圖搜圖之模型篇：基於 InceptionV3 的模型 finetune