PyTorch學習系列(十五)——如何載入預訓練模型？

阿新 • • 發佈：2019-01-05

PyTorch提供的預訓練模型

PyTorch定義了幾個常用模型，並且提供了預訓練版本：

AlexNet: AlexNet variant from the “One weird trick” paper.
VGG: VGG-11, VGG-13, VGG-16, VGG-19 (with and without batch normalization)
ResNet: ResNet-18, ResNet-34, ResNet-50, ResNet-101, ResNet-152
SqueezeNet: SqueezeNet 1.0, and SqueezeNet 1.1

預訓練模型可以通過設定pretrained=True來構建：

import torchvision.models as models
resnet18 = models.resnet18(pretrained=True)
vgg16 = models.vgg16(pretrained=True)
alexnet = models.alexnet(pretrained=True)
squeezenet = models.squeezenet1_0(pretrained=True)

預訓練模型期望的輸入是RGB影象的mini-batch：(batch_size, 3, H, W)，並且H和W不能低於224。影象的畫素值必須在範圍[0,1]間，並且用均值mean=[0.485, 0.456, 0.406]和方差std=[0.229, 0.224, 0.225]進行歸一化。

載入預訓練模型

torch.nn.Module物件有函式static_dict()用於返回包含模組所有狀態的字典，包括引數和快取。鍵是引數名稱或者快取名稱。

函式Module::load_state_dict(state_dict)用state_dict中的狀態值更新模組的狀態值。static_dict中的鍵應該和函式static_dict()返回的字典中的鍵完全一樣。

下面給出載入預訓練的模型的示例：

vgg16 = models.vgg16(pretrained=True)
pretrained_dict = vgg16.state_dict()
model_dict = model.state 
_dict()

# 1. filter out unnecessary keys
pretrained_dict = {k: v for k, v in pretrained_dict.items() if k in model_dict}
# 2. overwrite entries in the existing state dict
model_dict.update(pretrained_dict) 
# 3. load the new state dict
model.load_state_dict(model_dict)

PyTorch學習系列(十五)——如何載入預訓練模型？

PyTorch提供的預訓練模型 PyTorch定義了幾個常用模型，並且提供了預訓練版本： AlexNet: AlexNet variant from the “One weird trick” paper. VGG: VGG-11, VGG-13, VGG

pytorch學習筆記之載入預訓練模型

原文：https://blog.csdn.net/weixin_41278720/article/details/80759933 pytorch自發布以來，由於其便捷性，贏得了越來越多人的喜愛。 Pytorch有很多方便易用的包，今天要談的是torchvision包，

PyTorch學習系列(十)——如何在訓練時固定一些層？

有時我們會用其他任務（如分類）預訓練好網路，然後固定卷積層作為影象特徵提取器，然後用當前任務的資料只訓練全連線層。那麼PyTorch如何在訓練時固定底層只更新上層呢？這意味著我們希望反向傳播計算梯度時，我們只希望計算到最上面的卷積層，對於卷積層，我們並不希望計算

PyTorch學習系列(十六)——如何使用cuda進行訓練？

如果想在CUDA上進行計算，需要將操作物件放在GPU記憶體中。對於普通的張量，可以直接： x = torch.randn(2, 3) x = x.cuda() 對於神經網路： mode

PyTorch學習系列(十四)——儲存訓練好的模型

PyTorch提供了兩種儲存訓練好的模型的方法。第一種是隻儲存模型引數，這也是推薦的方法： #儲存 torch.save(the_model.state_dict(), PATH) #讀取 t

MXNet學習 (1) :載入預訓練模型

首先在MXNet的model zoo下載對應的模型描述檔案以及模型引數檔案： vgg16:對應vgg16.json vgg16-0000.params resnet50:對應resnet50.json resnet50-0000.params

Pytorch 快速入門（七）載入預訓練模型初始化網路引數

在預訓練網路的基礎上，修改部分層得到自己的網路，通常我們需要解決的問題包括： 1. 從預訓練的模型載入引數 2. 對新網路兩部分設定不同的學習率，主要訓練自己新增的層 PyTorch提供的預訓練模型PyTorch定義了幾個常用模型，並且提供了預訓練版本：AlexNet: Al

我的Keras使用總結（4）——Application中五款預訓練模型學習及其應用

　　本節主要學習Keras的應用模組 Application提供的帶有預訓練權重的模型，這些模型可以用來進行預測，特徵提取和 finetune，上一篇文章我們使用了VGG16進行特徵提取和微調，下面嘗試一下其他的模型。　　模型的預訓練權重將下載到 ~/.keras/models/ 並在載入模型時自動載入，當

動態匯入模組，載入預訓練模型，nn.Sequential函式裡面必須是a Module subclass，不能是一個列表或者是其他的迭代器、生成器，雖然這裡麵包含了Module的子類

class RES(nn.Module): def __init__(self): super(RES, self).__init__() self.conv1=nn.Conv2d(3,64,kernel_size=7,stride=2,pa

Tensorflow載入預訓練模型和儲存模型

使用tensorflow過程中，訓練結束後我們需要用到模型檔案。有時候，我們可能也需要用到別人訓練好的模型，並在這個基礎上再次訓練。這時候我們需要掌握如何操作這些模型資料。看完本文，相信你一定會有收穫！ 1 Tensorflow模型檔案我們在checkpo

文字分類實戰（十）—— BERT 預訓練模型文字分類實戰（一）—— word2vec預訓練詞向量

1 大綱概述　　文字分類這個系列將會有十篇左右，包括基於word2vec預訓練的文字分類，與及基於最新的預訓練模型（ELMo，BERT等）的文字分類。總共有以下系列：　　word2vec預訓練詞向量　　textCNN 模型　　charCNN 模型　　Bi-LSTM 模型　　Bi-LST

Hulu機器學習問題與解答系列 | 十五：多層感知機與布爾函數

功能目標機器學習分享圖片研究 vue gic per 發展今天沒有別的話，好好學習，多多轉發！本期內容是【多層感知機與布爾函數】場景描述神經網絡概念的誕生很大程度上受到了神經科學的啟發。生物學研究表明，大腦皮層的感知與計算功能是通過分多層實現的

pytorch 如何載入部分預訓練模型

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

機器學習與深度學習系列連載：第二部分深度學習（十五）迴圈神經網路 3（Gated RNN - GRU）

迴圈神經網路 3（Gated RNN - GRU） LSTM 是1997年就提出來的模型，為了簡化LSTM的複雜度，在2014年 Cho et al. 提出了 Gated Recurrent Units (GRU)。接下來，我們在LSTM的基礎上，介紹一下GRU。主要思路是： •

機器學習與深度學習系列連載：第一部分機器學習（十五）非監督度學習-2 Unsupervised Learning-2（Neighbor Embedding）

臨近編碼 Neighbor Embedding 在非監督學習降維演算法中，高緯度的資料，在他附近的資料我們可以看做是低緯度的，例如地球是三維度的，但是地圖可以是二維的。那我們就開始上演算法 1. Locally Linear Embedding (LLE) 我

PyTorch學習系列(一)——載入資料並生成batch資料

開始學習PyTorch，在此記錄學習過程。準備按順序寫以下系列：讀取資料生成並構建Dataset子類假設現在已經實現從資料檔案中讀取輸入images和標記labels（列表），那麼怎麼根據images和labels定義自己的資料集類？答案是作為t

pytorch學習筆記（五）：儲存和載入模型

# 儲存和載入整個模型 torch.save(model_object, 'model.pkl') model = torch.load('model.pkl') # 僅儲存和載入模型引數(推薦使

tensorflow學習系列六：mnist從訓練儲存模型再到載入模型測試

通過前面幾個系列的學習對tensorflow有了一個漸漸親切的感覺，本文主要是從tensorflow模型訓練與驗證的模型進行實踐一遍，以至於我們能夠通過tensorflow的訓練有一個整體的概念。下面主要是從訓練到儲存模型，然後載入模型進行預測。# -*- codin

【玩轉資料系列十五】機器學習PAI為你自動寫歌詞，媽媽再也不用擔心我的freestyle了（提供資料、程式碼）

摘要：背景最近網際網路上出現一個熱詞就是“freestyle”，源於一個比拼rap的綜藝節目。在節目中需要大量考驗選手的freestyle能力，freestyle指的是rapper即興的根據一段主題講一串rap。背景最近網際網路上出現一個熱詞就是“freest

Pytorch載入部分預訓練模型的引數

前言自從從深度學習框架caffe轉到Pytorch之後，感覺Pytorch的優點妙不可言，各種設計簡潔，方便研究網路結構修改，容易上手，比TensorFlow的臃腫好多了。對於深度學習的初學者，Pytorch值得推薦。今天主要主要談談Pytorch是如何載入預訓練模型的引數以

PyTorch學習系列(十五)——如何載入預訓練模型？

PyTorch提供的預訓練模型

載入預訓練模型

相關推薦