pytorch學習筆記（十一）：fine-tune 預訓練的模型

阿新 • • 發佈：2019-01-07

torchvision 中包含了很多預訓練好的模型，這樣就使得 fine-tune 非常容易。本文主要介紹如何 fine-tune torchvision 中預訓練好的模型。

安裝

pip install torchvision

如何 fine-tune

以 resnet18 為例：

from torchvision import models
from torch import nn
from torch import optim

resnet_model = models.resnet18(pretrained=True) 
# pretrained 設定為 True，會自動下載模型 所對應權重，並載入到模型中 

# 也可以自己下載 權重，然後 load 到 模型中，原始碼中有 權重的地址。

# 假設 我們的 分類任務只需要 分 100 類，那麼我們應該做的是
# 1. 檢視 resnet 的原始碼
# 2. 看最後一層的 名字是啥 （在 resnet 裡是 self.fc = nn.Linear(512 * block.expansion, num_classes)）
# 3. 在外面替換掉這個層
resnet_model.fc= nn.Linear(in_features=..., out_features=100)

# 這樣就 哦了，修改後的模型除了輸出層的引數是 隨機初始化的，其他層都是用預訓練的引數初始化的。 


# 如果只想訓練 最後一層的話，應該做的是：
# 1. 將其它層的引數 requires_grad 設定為 False
# 2. 構建一個 optimizer， optimizer 管理的引數只有最後一層的引數
# 3. 然後 backward， step 就可以了

# 這一步可以節省大量的時間，因為多數的引數不需要計算梯度
for para in list(resnet_model.parameters())[:-2]:
    para.requires_grad=False 

optimizer = optim.SGD(params=[resnet_model.fc.weight, resnet_model.fc.bias], lr=1e-3 
)

...

為什麼

這裡介紹下執行resnet_model.fc= nn.Linear(in_features=..., out_features=100)時框架內發生了什麼

這時應該看 nn.Module 原始碼的 __setattr__ 部分，因為 setattr 時都會呼叫這個方法：

def __setattr__(self, name, value):
    def remove_from(*dicts):
        for d in dicts:
            if name in d:
                del d[name]

首先映入眼簾就是 remove_from 這個函式，這個函式的目的就是，如果出現了同名的屬性，就將舊的屬性移除。用剛才舉的例子就是：

預訓練的模型中有個名字叫fc 的 Module。
在類定義外，我們將另一個 Module 重新賦值給了 fc。
類定義內的 fc 對應的 Module 就會從模型中刪除。

pytorch學習筆記（十一）：fine-tune 預訓練的模型

torchvision 中包含了很多預訓練好的模型，這樣就使得 fine-tune 非常容易。本文主要介紹如何 fine-tune torchvision 中預訓練好的模型。安裝 pip install torchvision 如何 fine

EF學習筆記（十一）：實施繼承

long cannot oid data- turn cati com list pac 學習總目錄：ASP.NET MVC5 及 EF6 學習筆記 - （目錄整理）上篇鏈接：EF學習筆記（十）處理並發本篇原文鏈接：Implementing Inheritance 面

R語言學習筆記（十一）：廣義線性模型

學習筆記 Education 5.0 1.3 style only 可能性 div erro #Logistic 回歸 install.packages("AER") data(Affairs,package="AER") summary(Affairs) a

hadoop學習筆記（十一）：MapReduce數據類型

筆記 ash all 記錄 write 一個操作 png bool 一、序列化 1 hadoop自定義了數據類型，在hadoop中，所有的key/value類型必須實現Writable接口。有兩個方法，一個是write，一個是readFileds。分別用於讀（反序列化操

javaweb學習筆記（十一）：JSP（1）

目錄 jsp（1） 1.基本概念 1 .1Jsp的執行過程 1.2 JSP與servlet 2 JSP語法 2.1 Jsp模板 2.2 Jsp表示式 2.3 Jsp指令碼 2.4 Jsp宣告 2.5 Jsp註釋 jsp（1） 1.基本

學習筆記（十一）：使用K-Means演算法檢測DGA域名

1.資料收集與清洗：同（十） 2.特徵化：同（十） 3.訓練樣本 model = KMeans(n_clusters = 2, random_state=random_state) y_pred = model.fit_predict(x) 4.效果驗證：使用TSNE將

機器學習筆記（十一）： TensorFlow實戰三（MNIST數字識別問題）

1 - MNIST數字識別問題前面介紹了這樣用TensorFlow訓練一個神經網路模型和主要考慮的問題及解決這些問題的常用方法。下面我們用一個實際的問題來驗證之前的解決方法。我們使用的是MNIST手寫數字識別資料集。在很多深度學習教程中，這個資料集都會被當做一個案例。 1.1

Python學習筆記（十一）：Python函式

以Mark Lutz著的《Python學習手冊》為教程，每天花1個小時左右時間學習，爭取兩週完成。 --- 寫在前面的話 2013-7-21 22:00 學習筆記 1，def是Python中的一個可執行語句——函式並不存在，直到Python運行了def後才存

各種音視訊編解碼學習詳解之編解碼學習筆記（十一）：Flash Video系列

最近在研究音視訊編解碼這一塊兒，看到@bitbit大神寫的【各種音視訊編解碼學習詳解】這篇文章，非常感謝，佩服的五體投地。奈何大神這邊文章太長，在這裡我把它分解成很多小的篇幅，方便閱讀。大神部落格傳送門：https://www.cnblogs.com/skyofbitbit/p/3651

pytorch學習筆記（十七）：python 端擴充套件 pytorch

pytorch 雖然提供了很多的 op 使得我們很容易的使用。但是當已有的 op 無法滿足我們的要求的時候，那就需要自己動手來擴充套件。 pytorch 提供了兩種方式來擴充套件 pytorch 的基礎

tensorflow學習筆記（十一）：seq2seq Model相關介面介紹

原始碼地址呼叫外部的函式介紹 tf.sampled_softmax_loss() tf.sampled_softmax_loss()中呼叫了_compute_sampled_logits() 關於__compute_sampled_logits()

莫煩pytorch學習筆記（十一）——Optimizer優化器

建造第一個神經網路——Optimizer優化器要點這節內容主要是用 Torch 實踐，中起到的幾種優化器。下圖就是這節內容對比各種優化器的效果: 偽資料為了對比各種優化器的效果, 我們需要有一些資料, 今天我們還是自己編一些偽資料, 這批資料是這樣的

Java for Web學習筆記（十一）：JSP（1）何為JSP

使用JSP 通java程式碼來編寫HTML很是繁瑣，通過使用JSTL（JSP標準標籤庫，JavaServer Pages™ Standard Tag Library），通過JSP來更便攜的實現。對JSP的支援Maven中包括javax.servlet.jsp-api、javax.servlet.jsp.js

pytorch學習筆記（十四）： DataLoader原始碼閱讀

pytorch 資料載入部分的介面可以說是現存深度學習框架中設計的最好的，給了我們足夠的靈活性。本博文就對 pytorch 的多執行緒載入模組（DataLoader）進行原始碼上的註釋。輸入流水線 pytorch 的輸入流水線的操作順序是這

pytorch學習筆記（十二）：詳解 Module 類

Module 是 pytorch 提供的一個基類，每次我們要搭建自己的神經網路的時候都要繼承這個類，繼承這個類會使得我們搭建網路的過程變得異常簡單。本文主要關注 Module 類的內部是怎麼樣

cortex_m3_stm32嵌入式學習筆記（十一）：TFTLCD顯示（初涉顯示器）

#ifndef __LCD_H #define __LCD_H #include "sys.h" #include "stdlib.h" //LCD重要引數集 typedef struct { u16 width; //LCD 寬度 u16 height;

Unity3D學習筆記（十一）：布料和協程

tro 可執行判斷思考 update1 iat nco game 對象延遲函數：動態資源加載：T：Resources.Load<T>(string path);Assets - Resources，Resources是一個資源管理的工具類，預制體放在Res

pytorch學習筆記（十六）：pytorch 寫程式碼時應該注意

當網路中有 dropout，bn 的時候。訓練的要記得 net.train(), 測試要記得 net.eval() 在測試的時候建立輸入 Variable 的時候要記得 volatile=Tru

Java高並發程序設計學習筆記（十一）：Jetty分析

factory reg base block tco ini reject blocking ews 轉自：https://blog.csdn.net/dataiyangu/article/details/87894253 new Server()初始化線程池Queued

學習筆記（十二）：推薦系統-隱語義模型

#程式碼摘自唐宇迪《推薦系統》視訊課程，資料集來自http://pan.baidu.com/s/1eS5VZ8Y中的“ml-1m"資料 from collections import deque from six import next import readers import tensor

pytorch學習筆記（十一）：fine-tune 預訓練的模型

安裝

如何 fine-tune

為什麼

相關推薦