keras 深度學習之遷移學習和fine tune

阿新 • • 發佈：2019-01-31

一.遷移學習
就是說把別人訓練好的網路(比如說卷積特徵提取部分)拿過來配合上自己分類器，這樣可以增加訓練的速度和提高分類效果。

'''
Created on 2018年8月28日

'''
#遷移學習
import keras
from keras.models import Model
from keras.applications import ResNet50
import numpy as np
from keras.preprocessing.image import ImageDataGenerator


train_data_dir = "data/train"
valid_data_dir = "data/valid" 

img_width, img_height = 224,224
batch_size = 32
train_samples_nums = 14000
valid_samples_nums = 1400

#遷移學習使用的是ResNet,只需要ResNet的特徵提取部分
model = ResNet50(weights="model/resnet50_weights_tf_dim_ordering_tf_kernels_notop.h5", include_top=False)
datagen = ImageDataGenerator(rescale=1. / 255)

#分別定義train，valid的資料生成器 

train_generator = datagen.flow_from_directory(
    train_data_dir,
    target_size=(img_width, img_height),
    batch_size=batch_size,
    class_mode=None,
    shuffle=False)
valid_generator = datagen.flow_from_directory(
    valid_data_dir,
    target_size=(img_width, img_height),
    batch_size=batch_size,
    class_mode=None 
,
    shuffle=False)

#使用ResNet提取特徵，生成新的特徵，儲存成np格式
bottleneck_train_features = model.predict_generator(train_generator, train_samples_nums // batch_size)
np.save(open('train_features.npy', 'wb'),bottleneck_train_features)
bottleneck_valid_features = model.predict_generator(valid_generator, valid_samples_nums // batch_size)
np.save(open('valid_features.npy', 'wb'), bottleneck_valid_features)

#重新讀取資料，定義標籤
train_data = np.load(open('bottleneck_features_train.npy', 'rb'))
train_labels = np.array([0] * (train_samples_nums // 2) + [1] * (train_samples_nums // 2))
valid_data = np.load(open('bottleneck_features_validation.npy', 'rb'))
valid_labels = np.array([0] * (valid_samples_nums // 2) + [1] * (valid_samples_nums // 2))
#以上就是通過遷移學習提取特徵，下面可以使用分類器，對這些特徵進行分類.
# 分類器可以是SVM,MLP,CNN,RNN,RF,XGBOOST,lightGBM
# 比如:使用SVM
from sklearn.svm import SVC
clf = SVC()
clf.set_params(kernel="linear",probability=True).fit(train_data, train_labels)

二.fine tune(微調)
一般在遷移學習的時候時候。也就是在將別人的訓練好的網路拿過來，然後加上自己分類層(一般使用的是加上自己的卷積層+全連線層，或者直接全連線層)，其中別人的網路可以設定為全部可訓練，也可以設定部分可訓練，最後學習率可以調低一點，一般取0.0001-0.001。

'''
Created on 2018年8月28日

'''
#fine tune
#首先需要自己寫個ResNet,這些程式碼都可以在from keras.applications import ResNet50中拷貝
from keras.layers import Input, Add, Dense, Activation, Flatten, Conv2D, BatchNormalization,MaxPooling2D,Concatenate,Lambda,AveragePooling2D
from keras import backend as K
from keras import layers
from keras.models import Model
from keras.optimizers import SGD

#定義resnet的殘差模組
def identity_block(input_tensor, kernel_size, filters, stage, block):

    filters1, filters2, filters3 = filters
    if K.image_data_format() == 'channels_last':
        bn_axis = 3
    else:
        bn_axis = 1
    conv_name_base = 'res' + str(stage) + block + '_branch'
    bn_name_base = 'bn' + str(stage) + block + '_branch'

    x = Conv2D(filters1, (1, 1), name=conv_name_base + '2a')(input_tensor)
    x = BatchNormalization(axis=bn_axis, name=bn_name_base + '2a')(x)
    x = Activation('relu')(x)

    x = Conv2D(filters2, kernel_size,
               padding='same', name=conv_name_base + '2b')(x)
    x = BatchNormalization(axis=bn_axis, name=bn_name_base + '2b')(x)
    x = Activation('relu')(x)

    x = Conv2D(filters3, (1, 1), name=conv_name_base + '2c')(x)
    x = BatchNormalization(axis=bn_axis, name=bn_name_base + '2c')(x)

    x = layers.add([x, input_tensor])
    x = Activation('relu')(x)
    return x


def conv_block(input_tensor, kernel_size, filters, stage, block, strides=(2, 2)):

    filters1, filters2, filters3 = filters
    if K.image_data_format() == 'channels_last':
        bn_axis = 3
    else:
        bn_axis = 1
    conv_name_base = 'res' + str(stage) + block + '_branch'
    bn_name_base = 'bn' + str(stage) + block + '_branch'

    x = Conv2D(filters1, (1, 1), strides=strides,
               name=conv_name_base + '2a')(input_tensor)
    x = BatchNormalization(axis=bn_axis, name=bn_name_base + '2a')(x)
    x = Activation('relu')(x)

    x = Conv2D(filters2, kernel_size, padding='same',
               name=conv_name_base + '2b')(x)
    x = BatchNormalization(axis=bn_axis, name=bn_name_base + '2b')(x)
    x = Activation('relu')(x)

    x = Conv2D(filters3, (1, 1), name=conv_name_base + '2c')(x)
    x = BatchNormalization(axis=bn_axis, name=bn_name_base + '2c')(x)

    shortcut = Conv2D(filters3, (1, 1), strides=strides,
                      name=conv_name_base + '1')(input_tensor)
    shortcut = BatchNormalization(axis=bn_axis, name=bn_name_base + '1')(shortcut)

    x = layers.add([x, shortcut])
    x = Activation('relu')(x)
    return x

def MyResNet():
    if K.image_data_format() == 'channels_last':
        bn_axis = 3
    else:
        bn_axis = 1
    input_shape_img = (224, 224, 3)

    img_input = Input(shape=input_shape_img)

    x = Conv2D(
        64, (7, 7), strides=(2, 2), padding='same', name='conv1')(img_input)
    x = BatchNormalization(axis=bn_axis, name='bn_conv1')(x)
    x = Activation('relu')(x)
    x = MaxPooling2D((3, 3), strides=(2, 2))(x)

    x = conv_block(x, 3, [64, 64, 256], stage=2, block='a', strides=(1, 1))
    x = identity_block(x, 3, [64, 64, 256], stage=2, block='b')
    x = identity_block(x, 3, [64, 64, 256], stage=2, block='c')

    x = conv_block(x, 3, [128, 128, 512], stage=3, block='a')
    x = identity_block(x, 3, [128, 128, 512], stage=3, block='b')
    x = identity_block(x, 3, [128, 128, 512], stage=3, block='c')
    x = identity_block(x, 3, [128, 128, 512], stage=3, block='d')

    x = conv_block(x, 3, [256, 256, 1024], stage=4, block='a')
    x = identity_block(x, 3, [256, 256, 1024], stage=4, block='b')
    x = identity_block(x, 3, [256, 256, 1024], stage=4, block='c')
    x = identity_block(x, 3, [256, 256, 1024], stage=4, block='d')
    x = identity_block(x, 3, [256, 256, 1024], stage=4, block='e')
    x = identity_block(x, 3, [256, 256, 1024], stage=4, block='f')

    x = conv_block(x, 3, [512, 512, 2048], stage=5, block='a')
    x = identity_block(x, 3, [512, 512, 2048], stage=5, block='b')
    x = identity_block(x, 3, [512, 512, 2048], stage=5, block='c')

    #加入自己的全連線層分類器，就行了
    x = Flatten()(x)
    x = Dense(2, activation='softmax', name='fc2')(x)


    model = Model(img_input, x, name='mymodel')
    return model

model = MyResNet()
model.summary()
#載入權重
resnet_weight = "model/resnet50_weights_tf_dim_ordering_tf_kernels_notop.h5"
model.load_weights(resnet_weight, by_name=True)
#也可以指定哪一層可以進行訓練
for layer in model.layers[:10]:
    layer.trainable = False
#編譯模型,然後一般fine tune都使用比較低的學習率
sgd = SGD(lr=0.0001, decay=0.00002, momentum=0.9, nesterov=True)
model.compile(optimizer=sgd, loss='categorical_crossentropy', metrics=['accuracy'])

keras 深度學習之遷移學習和fine tune

一.遷移學習就是說把別人訓練好的網路(比如說卷積特徵提取部分)拿過來配合上自己分類器，這樣可以增加訓練的速度和提高分類效果。 ''' Created on 2018年8月28日 ''' #遷移學習 import keras from keras.

深度學習之卷積和反捲積tensorflow

ps 零零總總接觸深度學習有1年了，雖然時間是一段一段的。現在再拾起來做一個新的專案，有些東西又要重新理解，感覺麻煩。現在就再次學習時候有些困惑的地方捋一遍。 1.卷積說到卷積，我現在還有印象的是大學裡《訊號與系統》和《數字訊號處理》兩書中的離散訊號的卷積。簡單來你說就是一個訊號固定，一個

cs231n-(9)遷移學習和Fine-tune網路

遷移學習更多參考遷移學習在實踐中，由於資料集不夠大，很少有人從頭開始訓練網路。常見的做法是使用預訓練的網路（例如在ImageNet上訓練的分類1000類的網路）來重新fine-tune，或者當做特徵提取器。常見的兩類遷移學習場景：

Python自動化3.0-------學習之路------日期和時間！

unix dst python自動化相關 http -a 年份字符串 cti Python 日期和時間 Python 程序能用很多方式處理日期和時間，轉換日期格式是一個常見的功能。 Python 提供了一個 time 和 calendar 模塊可以用於格式化日期和時間。

oracle學習之基本查詢和條件過濾，分組函數使用

pic sub 排序 acl date 數值模糊查詢使用 char oracle是殷墟出土的甲骨文的第一個單詞，所以在中國叫做甲骨文，成立於1977年，總部位於美國加州。在安裝好後，主要有兩個服務需要開啟： 1，實例服務，OracleServiceORCL，決定是否可

shell學習之變量和引號

11.變量的概念：變量是程序中保存用戶的一塊內存空間，變量名就是這塊內存空間的地址，變量的值保存在計算機內存中。變量的定義：可以簡單的理解，變量就是內存中一個鍵值關系對，如下 A可以理解為其在內存中的地址，1為其具體的內容。 [root@node-2 ~]# A=1 [root@node-2 ~]# echo

jquery學習之初始化和獲取值

pan AS jquery UNC function jquery對象加載就會獲取值 jquery在運行的時候在界面加載完之後再加載jquery對象，jquery加載的元素就會被加載出來 $(document).ready(function(){　　//這裏填寫需

小白的java學習之路 “ 類和對象”

之路抽象 AS 類和對象可維護屬性和方法 style “.” 信息一.※ 萬物皆對象二.對象的兩個特征：屬性：對象具有的各種特征方法：對象執行的操作對象：用來描述客觀事物的一個實體，由一組屬性和方法構成三.

Linux學習之十三-vi和vim編輯器及其快捷鍵

man 參考 AS 選擇都是常用 linu ins align vi和vim編輯器及其快捷鍵 1、vi與vim區別它們都是多模式編輯器，不同的是vim 是vi的升級版本，它不僅兼容vi的所有指令，而且還有一些新的特性在裏面。 vim的這些優勢主要體現在以下幾個方面：

Python學習之路 —— *args 和**kwargs

轉載自部落格園： http://www.cnblogs.com/moodlxs/p/3232222.html 當函式的引數不確定時，可以使用*args 和**kwargs，*args 沒有key值，**kwargs有key值。話不多說直接上程式碼 [python] de

JSP學習之---運用useBean和jdbc操作。實現簡答前臺操作資料庫。

JSP學習之—運用useBean和jdbc操作。實現簡答前臺操作資料庫。功能描述 1 . 在”student”表中查詢所有大於特定年齡的學生資訊，此年齡由使用者指定（提示，在網頁上面新增一個文字框用於使用者輸入年齡，然後根據使用者輸入的年齡建立sql語句，下面加一個按鈕，單擊按

C++PrimerPlus學習之記憶體模型和名稱空間

標頭檔案如果檔名包含在尖括號中，則C++編譯器將在儲存標準標頭檔案的主機系統的檔案系統的中查詢。如果檔名包含在雙引號中，則編譯器將在當前目錄下查詢。使用條件編譯防止多次包含標頭檔案 #ifndef XXX_H_ #define XXX_H_ ... #en

機器學習之擬合和過擬合問題

過擬合：當某個模型過度的學習訓練資料中的細節和噪音，以至於模型在新的資料上表現很差，我們稱過擬合發生了，通俗點就是：模型在訓練集中測試的準確度遠遠高於在測試集中的準確度。過擬合問題通常發生在變數特徵過多的時候。這種情況下訓練出的方程總是能很好的擬合訓練資料，也就是說，我們的代價函式可能非常接近於0或者就為

機器學習之---生成模型和判別模型

監督學習方法可分為兩大類，即生成方法與判別方法，它們所學到的模型稱為生成模型與判別模型。判別模型：判別模型是學得一個分類面（即學得一個模型），該分類面可用來區分不同的資料分別屬於哪一類；生成模型：生成模型是學得各個類別各自的特徵（即可看成學得多個模型），可用這些

機器學習之---class-aware 和 class-agnostic

For a class-aware detector, if you feed it an image, it will return a set of bounding boxes, each box associated with the class of the object inside (

機器學習之判別式模型和生成式模型

https://www.cnblogs.com/nolonely/p/6435213.html 判別式模型（Discriminative Model）是直接對條件概率p(y|x;θ)建模。常見的判別式模型有線性迴歸模型、線性判別分析、支援向量機SVM、神經網路、boosting

機器學習之采樣和變分（八）

坐標 led 學習工具 pan 相對拒絕轉移除了每一個摘要：　　當我們已知模型的存在，想知道參數的時候我們就可以通過采樣的方式來獲得一定數量的樣本，從而學習到這個系統的參數。變分則是在采樣的基礎上的一次提升，采用相鄰結點的期望。這使得變分往往比采樣算法更高效：用

機器學習之Apriori演算法和FP-growth演算法

1 關聯分析無監督機器學習方法中的關聯分析問題。關聯分析可以用於回答"哪些商品經常被同時購買？"之類的問題。 2 Apriori演算法頻繁項集即出現次數多的資料集支援度就是幾個關聯的資料在資料集中出現的次數佔總資料集的比重。或者說幾個資料關聯出現的概率。置信度體現了一個數據出現後，另

Python學習之圖片對比和識別小記

因工作中需要對視訊圖片做處理，於是就把應用得到的幾個需求功能在網上solo了一波。一、圖片對比主要應用的庫Image,函式Image.size(),resize(),convert(),getpixel(), 1、根據R-G -B三原色原理：只要使R=G=B，三者的值相等就可以

PyTorch之遷移學習（Transfer Learning）

TRANSFER LEARNING TUTORIAL Finetuning the convnet: Instead of random initializaion, we initialize the network with a pretrained network, l

keras 深度學習之遷移學習和fine tune

相關推薦