[ Keras ] ——基本使用：(2) fine-tune+凍結層+抽取模型某一層輸出

阿新 • • 發佈：2019-01-23

一、凍結層 (即固定某層引數在訓練的時候不變)

1.1方法：

x = Dense(100,activation='relu',name='dense_100',trainable=False)(inputs)

或者

model.trainable = False

1.2凍結操作的經驗總結：

1、凍結操作在訓練時候對權重影響實驗：

1) 不凍結：

# ■■■■■■■■ [2]模型設計 ■■■■■■■■
####### 主模型 #######

inputs = Input(shape=(784,))
x = Dense(100,activation='relu',name='dense_100')(inputs)
outputs = Dense(10,activation='softmax')(x)
model_main = Model(input = inputs,output=outputs)

####### 主模型 #######

model_main.load_weights('my_model_weights.h5')
 
# model_main.trainable = False 
 
model = model_main
 
# ****** 權重探針 ********
a = model.get_weights()
print('dense_100那層的權重:', a[1]) # 'dense_100'那層的權重。
# ****** 權重探針 ********
 
【結果】
>>> dense_100那層的權重:
[ 0.00609367  0.01774433  0.00127991  0.01685369 -0.00588948  0.0022781
  0.00694803  0.00636634 -0.00108383 -0.00480387  0.01123319  0.01685128
  0.0071973   0.00373418  0.0015275  -0.0011526  -0.00451979 -0.00653248
  0.01192301 -0.00078739 -0.00056679 -0.00057205  0.0220937  -0.00158271
 -0.00026968 -0.00664996 -0.00085808 -0.00305471  0.00620055  0.0064344
 -0.00938795  0.00266371  0.00623808  0.0083605  -0.00238177 -0.00048903
  0.00059158  0.00824707  0.00500612  0.00873516 -0.0032067   0.00337419
  0.01087511  0.004928    0.01195703  0.01690748  0.01420193 -0.0064415
  0.00545023  0.01340502 -0.00258121  0.01323839  0.00632899  0.01284719
  0.00555667  0.01261076 -0.00088008  0.01200596  0.00733639  0.01783392
 -0.00440101  0.00118115  0.01178464  0.0074486   0.00896501  0.00357948
  0.00705922  0.00520497  0.01415215 -0.00202574  0.00927804  0.0138014
  0.0098721   0.0129296   0.00189565  0.01651774  0.00946718 -0.00534614
  0.00506906 -0.00030766 -0.00026362  0.00419401  0.00212149 -0.00304823
 -0.00427098  0.0041138   0.01505729  0.00112592 -0.00334759  0.00820872
 -0.01345768 -0.00101386 -0.00698254  0.02179425  0.00819413  0.00404393
 -0.00315165  0.01334981  0.01426365  0.00202925]

2) 凍結之後：並且將探針放在model.fit之後

# ■■■■■■■■ [2]模型設計 ■■■■■■■■

####### 主模型 ######

inputs = Input(shape=(784,))
x = Dense(100,activation='relu',name='dense_100')(inputs)
outputs = Dense(10,activation='softmax')(x)
model_main = Model(input = inputs,output=outputs)

####### 主模型 ######


model_main.load_weights('my_model_weights.h5')

model_main.trainable = False 

model = model_main

# ■■■■■■■■ [3]模型編譯 ■■■■■■■■
# 定義優化器
sgd = SGD(lr=0.2)

# 編譯，loss function，訓練過程中計算準確率
model.compile(optimizer = sgd,
              loss = 'mse',
              metrics=['accuracy'],
              )


# ■■■■■■■■ [4]訓練模型 ■■■■■■■■

model.fit(x_train,y_train,batch_size=256,epochs=1)  # 主模型訓練用這個

# ****** 權重探針 ********
a = model.get_weights()
print('凍結訓練，訓練之後，dense_100那層的權重:', a[1]) # 'dense_100'那層的權重。
# ****** 權重探針 ********

【結果】
>>>凍結訓練，訓練之後，dense_100那層的權重:(發現沒有變化！！)
[ 0.00609367  0.01774433  0.00127991  0.01685369 -0.00588948  0.0022781
  0.00694803  0.00636634 -0.00108383 -0.00480387  0.01123319  0.01685128
  0.0071973   0.00373418  0.0015275  -0.0011526  -0.00451979 -0.00653248
  0.01192301 -0.00078739 -0.00056679 -0.00057205  0.0220937  -0.00158271
 -0.00026968 -0.00664996 -0.00085808 -0.00305471  0.00620055  0.0064344
 -0.00938795  0.00266371  0.00623808  0.0083605  -0.00238177 -0.00048903
  0.00059158  0.00824707  0.00500612  0.00873516 -0.0032067   0.00337419
  0.01087511  0.004928    0.01195703  0.01690748  0.01420193 -0.0064415
  0.00545023  0.01340502 -0.00258121  0.01323839  0.00632899  0.01284719
  0.00555667  0.01261076 -0.00088008  0.01200596  0.00733639  0.01783392
 -0.00440101  0.00118115  0.01178464  0.0074486   0.00896501  0.00357948
  0.00705922  0.00520497  0.01415215 -0.00202574  0.00927804  0.0138014
  0.0098721   0.0129296   0.00189565  0.01651774  0.00946718 -0.00534614
  0.00506906 -0.00030766 -0.00026362  0.00419401  0.00212149 -0.00304823
 -0.00427098  0.0041138   0.01505729  0.00112592 -0.00334759  0.00820872
 -0.01345768 -0.00101386 -0.00698254  0.02179425  0.00819413  0.00404393
 -0.00315165  0.01334981  0.01426365  0.00202925]

2、對儲存模型進行凍結操作的注意事項：

1)、要想對儲存模型進行凍結操作，建議使用 [結構儲存(model.to_json()) + 權值儲存(model.save_weights)] 這種方法儲存模型。

# 正常模型的引數：

=================================================================
Total params: 2,100,362
Trainable params: 2,100,362
Non-trainable params: 0
_________________________________________________________________

原因：

> 採用 model.save() 和 load_model()的方法得到的模型，在做凍結操作時候會發生權重錯誤。

from keras.models import load_model
model1 = load_model('CIFAR10_model_epoch_1.h5')

model1.trainable = False

model1.summary()

# ———— 看看參與訓練的權值都是什麼————
print('參與訓練的權值：')
for x in model1.trainable_weights:
    print(x.name)
    print('\n')
# —————————————————————————————————

【結果】
>>>
=================================================================
Total params: 4,200,724   (總權重咋就變多了？)
Trainable params: 2,100,362 (為什麼還有可訓練的權重？？？？)
Non-trainable params: 2,100,362
_________________________________________________________________

參與訓練的權值：    (參與訓練的權值倒是沒有。奇怪奇怪！)
(無)

> 採用 [ 結構儲存(model.to_json()) + 權值儲存(model.save_weights) ]，在做凍結操作時候就不會發生權重錯誤。

from keras.models import model_from_json
model1 = model_from_json(open('my_model_architecture.json').read())

model1.trainable = False

model1.load_weights('model_weight_epoch_1.h5')

model1.summary()

【結果】
>>>
=================================================================
Total params: 2,100,362
Trainable params: 0   (看！這個就沒錯！！)
Non-trainable params: 2,100,362
_________________________________________________________________

3、如果網路層的定義部分：

y = Dense(units=128, activation='relu', kernel_initializer='he_normal',trainable=False)(y)

定義了trainable=False，那麼就不能通過model.trainable = True 來改變這一層的'凍結狀態';

x = Input(shape=(32, 32, 3))
y = x
y = Convolution2D(filters=64, kernel_size=3, strides=1, padding='same', activation='relu', kernel_initializer='he_normal')(y)
y = MaxPooling2D(pool_size=2, strides=2, padding='valid')(y)
y = Flatten()(y)
y = Dense(units=128, activation='relu', kernel_initializer='he_normal',trainable=False)(y)
y = Dropout(0.5)(y)
y = Dense(units=nb_classes, activation='softmax', kernel_initializer='he_normal')(y)

model1 = Model(inputs=x, outputs=y, name='model1')

model1.trainable = True  # 看！我讓全部層都可以train了

model1.summary()

# ———— 看看不參與訓練的權值都是什麼————
print('不參與訓練的權值：')
for x in model1.non_trainable_weights:
    print(x.name)
print('\n')
# —————————————————————————————————

【結果】
>>>
=================================================================
Total params: 2,100,362
Trainable params: 3,082   
Non-trainable params: 2,097,280 (看！還是有不能訓練的引數)
_________________________________________________________________

不參與訓練的權值： (看！這是不能訓練的引數名稱)
dense_1/kernel:0 
dense_1/bias:0

但可以通過model.layers[4].trainable=True來改變：

x = Input(shape=(32, 32, 3))
y = x
y = Convolution2D(filters=64, kernel_size=3, strides=1, padding='same', activation='relu', kernel_initializer='he_normal')(y)
y = MaxPooling2D(pool_size=2, strides=2, padding='valid')(y)
y = Flatten()(y)
y = Dense(units=128, activation='relu', kernel_initializer='he_normal',trainable=False)(y)
y = Dropout(0.5)(y)
y = Dense(units=nb_classes, activation='softmax', kernel_initializer='he_normal')(y)

model1 = Model(inputs=x, outputs=y, name='model1')

model1.layers[4].trainable = True # 看！我讓這個Dense128層可train了

model1.summary()

# ———— 看看不參與訓練的權值都是什麼————
print('不參與訓練的權值：')
for x in model1.non_trainable_weights:
    print(x.name)
print('\n')
# —————————————————————————————————

【結果】
>>>
=================================================================
Total params: 2,100,362
Trainable params: 2,100,362
Non-trainable params: 0    (看！沒有了不能訓練的引數！)
_________________________________________________________________

不參與訓練的權值：
(無)

4、檢視可訓練(trainable)和不可訓練(non_trainable)的權值方法：

方法：model.trainable_weights (可訓練權值)

print('參與訓練的權值名稱：')
for x in model.trainable_weights:
    print(x.name)
print('\n')

方法：model.non_trainable_weights (不可訓練權值)
print('不參與訓練的權值名稱：')
for x in model.non_trainable_weights:
    print(x.name)
print('\n')

二、抽取某層輸出

# ■■■■■■■■ [2]模型設計 ■■■■■■■■

# ———— 主模型
inputs = Input(shape=(784,))
x = Dense(100,activation='relu')(inputs)
outputs = Dense(10,activation='softmax')(x)

model_main = Model(input = inputs,output=outputs)

model_main.load_weights('my_model_weights.h5')
# model_main.trainable = False

# model = model_main

# ———— 提取'dense_1'層的輸出。
layer_name = 'dense_1'
intermediate_layer_model = Model(input=inputs,
                                 output=model_main.get_layer(layer_name).output)
x_train_Dense = intermediate_layer_model.predict(x_train) # 將樣本x_train輸入得到'dense_1'層輸出。

print('x_train_Dense',x_train_Dense)
print('x_train_Dense.shape',x_train_Dense.shape)

三、 fine-tune

(1) 、主模型固定(不是凍結)不訓練的fine-tune

import numpy as np
from keras.datasets import mnist
from keras.utils import np_utils
from keras.models import Sequential
from keras.models import Model
from keras.layers import Input,Dense,Conv2D,Activation,MaxPooling2D,Flatten,merge,Conv2DTranspose,ZeroPadding2D
from keras.regularizers import l2
from keras.layers import Dense
from keras.optimizers import SGD
from keras import backend as K

# ■■■■■■■■ [1] 資料載入 ■■■■■■■■
(x_train,y_train),(x_test,y_test) = mnist.load_data()
# (60000,28,28)
print('x_shape:',x_train.shape)
# (60000)
print('y_shape:',y_train.shape)
# (60000,28,28)->(60000,784)
x_train = x_train.reshape(x_train.shape[0],-1)/255.0
x_test = x_test.reshape(x_test.shape[0],-1)/255.0
# 換one hot格式
y_train = np_utils.to_categorical(y_train,num_classes=10)
y_test = np_utils.to_categorical(y_test,num_classes=10)


# ■■■■■■■■ [2]模型設計 ■■■■■■■■

# ———— 主模型
inputs = Input(shape=(784,))
x = Dense(100,activation='relu')(inputs)
outputs = Dense(10,activation='softmax')(x)

model_main = Model(input = inputs,output=outputs)

model_main.load_weights('my_model_weights.h5')
# model_main.trainable = False

# model = model_main

# ———— 提取'dense_1'層的輸出。
layer_name = 'dense_1'
intermediate_layer_model = Model(input=inputs,
                                 output=model_main.get_layer(layer_name).output)
x_train_Dense = intermediate_layer_model.predict(x_train) # 將樣本x_train輸入得到'dense_1'層輸出。

np.save('bottleneck_features.npy', x_train_Dense)  # 將提取出的'dense_1'層的特徵儲存在.npy檔案中。
train_data = np.load('bottleneck_features.npy')    # 讀取.npy檔案中的特徵向量。
print('x_train_Dense',train_data)
print('x_train_Dense.shape',train_data.shape)

# ———— fine-tune模型

inputs1 = Input(shape=(100,)) # 由於取出上面model_main中的'dense_1'層輸出為100維。
x = Dense(100,activation='relu')(inputs1)
outputs1 = Dense(10,activation='softmax')(x)
model = Model(inputs1,outputs1)

model.summary()


# ■■■■■■■■ [3]模型編譯 ■■■■■■■■
# 定義優化器
sgd = SGD(lr=0.2)

# 編譯，loss function，訓練過程中計算準確率
model.compile(optimizer = sgd,
              loss = 'mse',
              metrics=['accuracy'],
              )

# ■■■■■■■■ [4]訓練模型 ■■■■■■■■

# model.fit(x_train,y_train,batch_size=64,epochs=1)  # 主模型訓練用這個
model.fit(x_train_Dense, y_train,batch_size=64, epochs=1) # fine-tune模型用這個


# ■■■■■■■■ [5]評估模型 ■■■■■■■■

# loss,accuracy = model.evaluate(x_test,y_test)

# print('\ntest loss',loss)
# print('accuracy',accuracy)

# # 儲存引數，載入引數
# model.save_weights('my_model_weights.h5')
# model.load_weights('my_model_weights.h5')

K.clear_session()

(2)、主模型不凍結的fine-tune——並且可以驗證主模型load_weight之後，連成fine-tune模型後，權重是否也在fine-tune模型中。

# ■■■■■■■■ [2]模型設計 ■■■■■■■■

# —————— 主模型 ——————
inputs = Input(shape=(784,))
x = Dense(100,activation='relu',name='dense_100')(inputs)
outputs = Dense(10,activation='softmax')(x)

model_main = Model(input = inputs,output=outputs)

model_main.load_weights('my_model_weights.h5')

# ———— (fine-tune構建)提取'dense_1'層的輸出 ——————
layer_name = 'dense_100'
intermediate_layer_model = Model(input=inputs,
                                 output=model_main.get_layer(layer_name).output)
outputs_inter = Dense(10,activation='softmax')(intermediate_layer_model.output)
model_inter = Model(input=inputs, output=outputs_inter)
model = model_inter

# ****** 權重探針 ********
a = model.get_weights()
print('主模型load_weight之後，去掉softmax層，接成fine-tune模型後的原dense_100層權重:', a[1]) # 'dense_100'那層的權重。
# ****** 權重探針 ********

【結果】(發現確實load進了fine-tune模型)
>>>主模型load_weight之後，去掉softmax層，接成fine-tune模型後的原dense_100層權重: 
[ 0.00609367  0.01774433  0.00127991  0.01685369 -0.00588948  0.0022781
  0.00694803  0.00636634 -0.00108383 -0.00480387  0.01123319  0.01685128
  0.0071973   0.00373418  0.0015275  -0.0011526  -0.00451979 -0.00653248
  0.01192301 -0.00078739 -0.00056679 -0.00057205  0.0220937  -0.00158271
 -0.00026968 -0.00664996 -0.00085808 -0.00305471  0.00620055  0.0064344
 -0.00938795  0.00266371  0.00623808  0.0083605  -0.00238177 -0.00048903
  0.00059158  0.00824707  0.00500612  0.00873516 -0.0032067   0.00337419
  0.01087511  0.004928    0.01195703  0.01690748  0.01420193 -0.0064415
  0.00545023  0.01340502 -0.00258121  0.01323839  0.00632899  0.01284719
  0.00555667  0.01261076 -0.00088008  0.01200596  0.00733639  0.01783392
 -0.00440101  0.00118115  0.01178464  0.0074486   0.00896501  0.00357948
  0.00705922  0.00520497  0.01415215 -0.00202574  0.00927804  0.0138014
  0.0098721   0.0129296   0.00189565  0.01651774  0.00946718 -0.00534614
  0.00506906 -0.00030766 -0.00026362  0.00419401  0.00212149 -0.00304823
 -0.00427098  0.0041138   0.01505729  0.00112592 -0.00334759  0.00820872
 -0.01345768 -0.00101386 -0.00698254  0.02179425  0.00819413  0.00404393
 -0.00315165  0.01334981  0.01426365  0.00202925]

(3)、讓模型中的某幾層不參加訓練。

model.layers方法：

# ——————————————————————— 主模型 ——————————————————————————

#....省略....

model1 = Model(inputs=x, outputs=y, name='model1')

# ——————————————— 只想讓後3層參加訓練(總共14層) ——————————————

print('\n 有多少個層(relu這種沒有引數的也算一層) :',len(model1.layers))

model1.trainable = True     # 想要讓某層參加訓練，必須'先'讓全部層[可訓練]，'再'讓不想參加訓練的層[凍結].

# 讓不想參加訓練的層[凍結].
for layer in model1.layers[:11]:
    layer.trainable = False

model1.summary()

# ————————————————————————————————————————————————————————————

【結果】
>>>
Total params: 1,671,114
Trainable params: 525,706
Non-trainable params: 1,145,408

[ Keras ] ——基本使用：(2) fine-tune+凍結層+抽取模型某一層輸出

一、凍結層 (即固定某層引數在訓練的時候不變) 1.1方法： x = Dense(100,activation='relu',name='dense_100',trainable=False)(inputs) 或者 model.trainable = False

Caffe：如何fine tune一個現有的網路（VGG16）——將資料預處理並儲存為h5格式

在訓練神經網路的過程中，常常需要fine tune一個現有的網路，首先是需要對輸入資料進行預處理，包括有：對尺寸大小進行處理將正負例和測試的data&label儲存為h5檔案將h5檔案中data&label對應的書序打亂實現程式碼

pytorch學習筆記（十一）：fine-tune 預訓練的模型

torchvision 中包含了很多預訓練好的模型，這樣就使得 fine-tune 非常容易。本文主要介紹如何 fine-tune torchvision 中預訓練好的模型。安裝 pip install torchvision 如何 fine

pytorch fine-tune 預訓練的模型

之一: torchvision 中包含了很多預訓練好的模型，這樣就使得 fine-tune 非常容易。本文主要介紹如何 fine-tune torchvision 中預訓練好的模型。安裝 pip install torchvision 如何 fine-tune 以

Keras 獲取中間某一層輸出

1.使用函式模型API，新建一個model，將輸入和輸出定義為原來的model的輸入和想要的那一層的輸出，然後重新進行predict. 1 #coding=utf-8 2 import seaborn as sbn 3 import pylab as plt 4 import theano

keras獲得某一層或者某層權重的輸出

一個例子： print("Loading vgg19 weights...") vgg_model = VGG19(include_top=False, weights=

tensorflow凍結部分層，只訓練某一層

其實常說的fine tune就是凍結網路前面的層，然後訓練最後一層。那麼在tensorflow裡如何實現finetune功能呢？或者說是如何實現凍結部分層，只訓練某幾個層呢？可以通過只選擇優化特定層的引數來實現該功能。示例程式碼如下： #定義優化運算元 optimizer = tf.trai

［百度面試題］100層樓，球可能會在某一層樓摔壞，問用2個球，最壞情況下幾次測試可以找出該樓層

該題還可以擴充套件，比如說給更多的球，如3個球，多少次測試可以找出樓層。分析如下：用動態規劃解這個問題設f(a, b)為a個球做b次測試可以測試到的樓層數，可以確定的樓層數即為f(a, b) + 1，因為第1層不需測試，需要測試的樓層號僅僅為[2, f(a, b) +

就算是沈蒼生來層一路闖回一層巨聲響徹雷霆

bdc add afa cda article fab def abc C4D http://baobao.baidu.com/article/d30810b1aa52e05e073ccb262af22620.html http://baobao.baidu.com/art

有一棟100層高的大樓，給你兩個完全相同的玻璃球。假設從某一層開始，丟下玻璃球會摔碎。那麽怎麽利用手中的兩個球，用什麽最優策略知道這個臨界的層是第幾層？

要求避免怎麽減少使用相同二分價值策略題目有一棟100層高的大樓，給你兩個完全相同的玻璃球。假設從某一層開始，丟下玻璃球會摔碎。那麽怎麽利用手中的兩個球，用什麽最優策略知道這個臨界的層是第幾層？？？　　每次肯定是由低的樓層往高的樓層嘗試，直到在樓層f(

Java中獲取資料庫中的資料，獲取下拉列表中的資料，獲取省、市、區的資料，根據上一層去控制下一層

$(function() { //validateRule(); getDept(); $("select[name='deptNamee']").change(function() { var deptCode = $("select[name='deptN

使用Caffe和訓練好的model從影象中提取某一層特徵

有時我們並不是需要分類結果，只要某一層的特徵，作為影象的特徵表示。 #encoding=utf8 ''' python2.7 ''' import numpy as np import os import argparse import caffe import sys impor

關於專案中彈出層中再彈一層中的解決辦法

開發做專案，新建修改一般都已經封裝好了彈出框的方法，在彈出的頁面如果再次呼叫封裝的彈出框的時候，會把原本的彈出框給覆蓋了，這樣就失去了想要的效果。在這個時候就需要用window.open()方法了 window.open(URL,name,features,replace)

Raycast 只射到某一層

Ray ray = Camera.main.ScreenPointToRay(Input.mousePosition); Debug.DrawRay(ray.origin, (ray.direction * 100), Color.red);

MFC：判斷點（POINT）是否在某一區域(CRect)

1.判斷一點是否在矩形區域內的方法： CRect rc (point_1,point_2);//構造矩形區域呼叫CRect::PtInRect BOOL flag = rc.PtInRect(point_key);if (flag){點point_key在構造的矩形區域內;}else點point_key不

兩個軟硬程度一樣的雞蛋，它們在某一層摔下會碎，有個100層的建築，要求最多用兩個雞蛋確定雞蛋安全下落的臨界位置，給出臨界位置？如果是n層樓，m個雞蛋，請給出確定臨界位置的演算法

題目：問題：一幢大樓共計100層，某種型別的雞蛋從某一樓層及其以上樓層摔下來時會被打破，從該層樓（即臨界樓層）以下樓層摔下該雞蛋，雞蛋不會出現破損。現給你2個完全一樣的該種類型的雞蛋，問：如何通過這2個雞蛋找到該臨界樓層時，所用的摔雞蛋次數最少？思考：給了我們2個雞

開發中遇到的關於時間的處理：設定時間範圍大於當前時間小於某一天

需求：在做類似於微博的android客戶端的時候，要求有個定時發微薄功能，時間設定要求：初始化時間大於當前時間兩分鐘，設定時間不能超過十五天。解決過程：在網上找了一部分參考資料，發現都不能很好的解決問題，查看了時間的API也沒有真正明白用法，據聽說java中最讓人費解的就

pandas按某一層索引分組取某一列的最大值，groupby()，idxmax()

本文是根據stackoverflow上一個問題進行的覆盤，若涉及任何侵權，請聯絡我修改或刪除。 stackoverflow原文連結 --> https://stackoverflow.com/questions/32459325/python-pandas-data

Keras：在預訓練的網路上fine-tune

準備 fine-tune的三個步驟: 搭建vgg-16並載入權重; 將之前定義的全連線網路載入到模型頂部,並載入權重; 凍結vgg16網路的一部分引數. 在之前的Keras：自建資料集影象分類的模型訓練、儲存與恢復裡製作了實驗用的資料集並初步進

面試題目：2個雞蛋100層樓問題

clas family 如果規劃數字 span time 試題一次題目：兩個軟硬程度一樣但未知的雞蛋，它們有可能都在一樓就摔碎，也可能從一百層樓摔下來沒事。有座100層的建築，要你用這兩個雞蛋確定哪一層是雞蛋可以安全落下的最高位置。可以摔碎兩個雞蛋。

[ Keras ] ——基本使用：(2) fine-tune+凍結層+抽取模型某一層輸出

相關推薦