『PyTorch』第十四彈_torch.nn.Module深入分析

阿新 • • 發佈：2018-03-04

dict html body als linear ogr highlight 9.1 htm

nn.Module基類的構造函數：

def __init__(self):
    self._parameters = OrderedDict()
    self._modules = OrderedDict()
    self._buffers = OrderedDict()
    self._backward_hooks = OrderedDict()
    self._forward_hooks = OrderedDict()
    self.training = True

其中每個屬性的解釋如下：

_parameters：字典，保存用戶直接設置的parameter，self.param1 = nn.Parameter(t.randn(3, 3))

會被檢測到，在字典中加入一個key為‘param‘，value為對應parameter的item。而self.submodule = nn.Linear(3, 4)中的parameter則不會存於此。
_modules：子module，通過self.submodel = nn.Linear(3, 4)指定的子module會保存於此。
_buffers：緩存。如batchnorm使用momentum機制，每次前向傳播需用到上一次前向傳播的結果。
_backward_hooks與_forward_hooks：鉤子技術，用來提取中間變量，類似variable的hook。
training：BatchNorm與Dropout層在訓練階段和測試階段中采取的策略不同，通過判斷training值來決定前向傳播策略。

上述幾個屬性中，_parameters、_modules和_buffers這三個字典中的鍵值，都可以通過self.key方式獲得，效果等價於self._parameters[‘key‘].

定義一個Module，這個Module即包含自己的Parameters有包含子Module及其Parameters，

import torch as t
from torch import nn
from torch.autograd import Variable as V

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        # 等價與self.register_parameter(‘param1‘ ,nn.Parameter(t.randn(3, 3)))
        self.param1 = nn.Parameter(t.rand(3, 3))
        self.submodel1 = nn.Linear(3, 4) 
    def forward(self, input):
        x = self.param1.mm(input)
        x = self.submodel11(x)
        return x
net = Net()

`一、_modules`

# 打印網絡對象的話會輸出子module結構
print(net)
Net(
  (submodel1): Linear(in_features=3, out_features=4)
)
# ._modules輸出的也是子module結構，不過數據結構和上面的有所不同
print(net.submodel1)
print(net._modules) # 字典子類
Linear(in_features=3, out_features=4)
OrderedDict([(‘submodel1‘, Linear(in_features=3, out_features=4))])
for name, submodel in net.named_modules():
print(name, submodel)
 Net(
  (submodel1): Linear(in_features=3, out_features=4)
)
submodel1 Linear(in_features=3, out_features=4)
print(list(net.named_modules())) # named_modules其實是包含了本層的module集合
[(‘‘, Net(
  (submodel1): Linear(in_features=3, out_features=4)
)), (‘submodel1‘, Linear(in_features=3, out_features=4))]

`二、_parameters`

# ._parameters存儲的也是這個結構
print(net.param1)
print(net._parameters) # 字典子類，僅僅包含直接定義的nn.Parameters參數
Parameter containing:
 0.6135  0.8082  0.4519
 0.9052  0.5929  0.2810
 0.6825  0.4437  0.3874
[torch.FloatTensor of size 3x3]

OrderedDict([(‘param1‘, Parameter containing:
 0.6135  0.8082  0.4519
 0.9052  0.5929  0.2810
 0.6825  0.4437  0.3874
[torch.FloatTensor of size 3x3]
)])
for name, param in net.named_parameters():
print(name, param.size())
param1 torch.Size([3, 3])
submodel1.weight torch.Size([4, 3])
submodel1.bias torch.Size([4])

`三、_buffers`

bn = nn.BatchNorm1d(2)
input = V(t.rand(3, 2), requires_grad=True)
output = bn(input)
bn._buffers

OrderedDict([(‘running_mean‘, 
              1.00000e-02 *
                9.1559
                1.9914
              [torch.FloatTensor of size 2]), (‘running_var‘, 
               0.9003
               0.9019
              [torch.FloatTensor of size 2])])

`四、training`

input = V(t.arange(0, 12).view(3, 4))
model = nn.Dropout()
# 在訓練階段，會有一半左右的數被隨機置為0
model(input)

Variable containing:
  0   2   4   0
  8  10   0   0
  0  18   0  22
[torch.FloatTensor of size 3x4]

model.training  = False
# 在測試階段，dropout什麽都不做
model(input)

Variable containing:
  0   1   2   3
  4   5   6   7
  8   9  10  11
[torch.FloatTensor of size 3x4]

Module.train()、Module.eval() 方法和 Module.training屬性的關系

print(net.training, net.submodel1.training)
net.train() # 將本層及子層的training設定為True
net.eval() # 將本層及子層的training設定為False
net.training = True # 註意，對module的設置僅僅影響本層，子module不受影響
net.training, net.submodel1.training

True True
(True, False)

『PyTorch』第十四彈_torch.nn.Module深入分析

dict html body als linear ogr highlight 9.1 htm nn.Module基類的構造函數： def __init__(self): self._parameters = OrderedDict() self._mo

『PyTorch』第十二彈_nn.Module和nn.functional

python 需要能夠學習 .com 測試 true brush randn 大部分nn中的層class都有nn.function對應，其區別是： nn.Module實現的layer是由class Layer(nn.Module)定義的特殊類，會自動提取可學習參數nn

『PyTorch』第十彈_循環神經網絡

() rom tac stack 區別 div .com and tput 『cs231n』作業3問題1選講_通過代碼理解RNN&圖像標註訓練對於torch中的RNN相關類，有原始和原始Cell之分，其中RNN和RNNCell層的區別在於前者一次能夠處理整個序列，

『PyTorch』第五彈_深入理解Tensor對象_中上：索引

nbsp 使用 gpo 簡單深入理解 pre 需要 sub ext 一、普通索引示例 a = t.Tensor(4,5) print(a) print(a[0:1,:2]) print(a[0,:2]) # 註意和前一種索引出來的值相同，shape不同 print(

『PyTorch』第五彈_深入理解Tensor對象_中下：數學計算以及numpy比較

python 輸入簡單相對 range pri std lin block 一、簡單數學操作 1、逐元素操作 t.clamp(a,min=2,max=4)近似於tf.clip_by_value(A, min, max),修剪值域。 a = t.arange(0,6).

『PyTorch』第五彈_深入理解autograd_上：Variable

ogr runt 無需 nbsp 移除數值 port auto hasattr 一、Variable類源碼簡介 class Variable(_C._VariableBase): """ Attributes: data: 任意類型的封

『PyTorch』第五彈_深入理解autograd_下：Variable梯度探究

def int 用法 req 就是 gpo size ble 節點查看非葉節點梯度的兩種方法在反向傳播過程中非葉子節點的導數計算完之後即被清空。若想查看這些變量的梯度，有兩種方法：使用autograd.grad函數使用hook autograd.grad和ho

『PyTorch』第五彈_深入理解autograd_下：函數擴展&高階導數

return turn 都是誤差 log inpu 能夠 () 是否一、封裝新的PyTorch函數繼承Function類 forward：輸入Variable->中間計算Tensor->輸出Variable backward：均使用Variable 線性映

『PyTorch』第六彈_最小二乘法的不同實現手段(待續)

int pri back imp python return red 最小 num PyTorch的Variable import torch as t from torch.autograd import Variable as V import matplotlib.

『PyTorch』第七彈_nn.Module擴展層

計數 area 除了直觀 .mm 而不是回收 mod div 有下面代碼可以看出torch層函數(nn.Module)用法，使用超參數實例化層函數類(常位於網絡class的__init__中)，而網絡class實際上就是一個高級的遞歸的nn.Module的class。

高並發第十四彈：線程池的介紹及使用

簡單 idt brush nano 減少線程池大小 core mit rmi 單線程就不說了因為簡單，並且在實際的生產環境中一般必須來說線程資源都是由線程池提供線程資源的。線程池的好處重用存在的線程，減少對象創建、消亡的開銷，性能好可有效控制最大並發線程數，提

高併發第十四彈：執行緒池的介紹及使用

單執行緒就不說了因為簡單，並且在實際的生產環境中一般必須來說執行緒資源都是由執行緒池提供執行緒資源的。執行緒池的好處重用存在的執行緒，減少物件建立、消亡的開銷，效能好可有效控制最大併發執行緒數，提高系統資源利用率，同時可以避免過多資源競爭，避免阻塞。提供定時執行、定期執行、單執行緒、併發數控制等

UI基礎第十四彈:接使用UITableView Controller

15天玩轉redis —— 第十篇對快照模式的深入分析

我們知道redis是帶有持久化這個能力了，那到底持久化成到哪裡，持久化成啥樣呢？？？這篇我們一起來尋求答案。一：快照模式　　或許在用Redis之初的時候，就聽說過redis有兩種持久化模式，第一種是SNAPSHOTTING模式，還是一種是AOF模式，而且在實

『PyTorch』第二彈_張量

ref play spl rip 出錯 margin logs 互轉演示參考：http://www.jianshu.com/p/5ae644748f21# 幾個數學概念：標量（Scalar）是只有大小，沒有方向的量，如1，2，3等向量（Vector）是有大小和方向的

『MXNet』第五彈_多GPU並行程序設計

計算模型 line lam 裏的完整 .so doc params 對象資料原文一、概述思路假設一臺機器上有k個GPU。給定需要訓練的模型，每個GPU將分別獨立維護一份完整的模型參數。在模型訓練的任意一次叠代中，給定一個小批量，我們將該批量中的樣本劃分成k份

『MXNet』第六彈_數據處理API（待續）

convert lena PE color bus AS array 維度 shuff 一、Gluon數據加載圖片數據(含標簽)加載函數：gluon.data.vision.ImageFolderDataset 給出ImageFolderDataset類的描述，

『MXNet』第七彈_分類器demo示意

padding NPU output nump class tensor rac 檢測 HA 解壓文件命令： with zipfile.ZipFile(‘../data/kaggle_cifar10/‘ + fin, ‘r‘) as zin:

『MXNet』第八彈_物體檢測之SSD

out can RR AS upd 全部 ask 類別 clu 預、API介紹 mxnet.metric from mxnet import metric cls_metric = metric.Accuracy() box_metric = metric.

Oracle PL/SQL開發基礎（第三十四彈：RAISE_APPLICATION_ERROR）

RAISE_APPLICATION_ERROR在子程式內部使用時，能從儲存子程式中丟擲自定義的錯誤訊息。這樣就能將錯誤報告給應用程式而避免範圍未捕獲異常。語法如下： RAISE_APPLICATI

『PyTorch』第十四彈_torch.nn.Module深入分析

一、_modules

二、_parameters

三、_buffers

四、training

Module.train()、Module.eval() 方法和 Module.training屬性的關系

相關推薦

`一、_modules`

`二、_parameters`

`三、_buffers`

`四、training`