『PyTorch』第五彈_深入理解autograd_上：Variable

阿新 • • 發佈：2018-02-15

ogr runt 無需 nbsp 移除數值 port auto hasattr

一、Variable類源碼簡介

class Variable(_C._VariableBase):

    """
    Attributes:
        data: 任意類型的封裝好的張量。
        grad: 保存與data類型和位置相匹配的梯度，此屬性難以分配並且不能重新分配。
        requires_grad: 標記變量是否已經由一個需要調用到此變量的子圖創建的bool值。只能在葉子變量上進行修改。
        volatile: 標記變量是否能在推理模式下應用（如不保存歷史記錄）的bool值。只能在葉變量上更改。
        is_leaf: 標記變量是否是圖葉子(如由用戶創建的變量)的bool值.
        grad_fn: Gradient function graph trace.

    Parameters:
        data (any tensor class): 要包裝的張量.
        requires_grad (bool): bool型的標記值. **Keyword only.**
        volatile (bool): bool型的標記值. **Keyword only.**
    """

    def backward(self, gradient=None, retain_graph=None, create_graph=None, retain_variables=None):
        """計算關於當前圖葉子變量的梯度，圖使用鏈式法則導致分化
        如果Variable是一個標量（例如它包含一個單元素數據），你無需對backward()指定任何參數
        如果變量不是標量（包含多個元素數據的矢量）且需要梯度，函數需要額外的梯度;
        需要指定一個和tensor的形狀匹配的grad_output參數（y在指定方向投影對x的導數）;
        可以是一個類型和位置相匹配且包含與自身相關的不同函數梯度的張量。
        函數在葉子上累積梯度，調用前需要對該葉子進行清零。

        Arguments:
            grad_variables (Tensor, Variable or None): 
                           變量的梯度，如果是一個張量，除非“create_graph”是True，否則會自動轉換成volatile型的變量。
                           可以為標量變量或不需要grad的值指定None值。如果None值可接受，則此參數可選。
            retain_graph (bool, optional): 如果為False，用來計算梯度的圖將被釋放。
                                           在幾乎所有情況下，將此選項設置為True不是必需的，通常可以以更有效的方式解決。
                                           默認值為create_graph的值。
            create_graph (bool, optional): 為True時，會構造一個導數的圖，用來計算出更高階導數結果。
                                           默認為False，除非``gradient``是一個volatile變量。
        """
        torch.autograd.backward(self, gradient, retain_graph, create_graph, retain_variables)


    def register_hook(self, hook):
        """Registers a backward hook.

        每當與variable相關的梯度被計算時調用hook，hook的申明：hook(grad)->Variable or None
        不能對hook的參數進行修改,但可以選擇性地返回一個新的梯度以用在`grad`的相應位置。

        函數返回一個handle，其``handle.remove()``方法用於將hook從模塊中移除。

        Example:
            >>> v = Variable(torch.Tensor([0, 0, 0]), requires_grad=True)
            >>> h = v.register_hook(lambda grad: grad * 2)  # double the gradient
            >>> v.backward(torch.Tensor([1, 1, 1]))
            >>> v.grad.data
             2
             2
             2
            [torch.FloatTensor of size 3]
            >>> h.remove()  # removes the hook
        """
        if self.volatile:
            raise RuntimeError("cannot register a hook on a volatile variable")
        if not self.requires_grad:
            raise RuntimeError("cannot register a hook on a variable that "
                               "doesn‘t require gradient")
        if self._backward_hooks is None:
            self._backward_hooks = OrderedDict()
            if self.grad_fn is not None:
                self.grad_fn._register_hook_dict(self)
        handle = hooks.RemovableHandle(self._backward_hooks)
        self._backward_hooks[handle.id] = hook
        return handle

    def reinforce(self, reward):
        """Registers a reward obtained as a result of a stochastic process.
        區分隨機節點需要為他們提供reward值。如果圖表中包含任何的隨機操作，都應該在其輸出上調用此函數，否則會出現錯誤。
        Parameters:
            reward(Tensor): 帶有每個元素獎賞的張量，必須與Variable數據的設備位置和形狀相匹配。
        """
        if not isinstance(self.grad_fn, StochasticFunction):
            raise RuntimeError("reinforce() can be only called on outputs "
                               "of stochastic functions")
        self.grad_fn._reinforce(reward)

    def detach(self):
        """返回一個從當前圖分離出來的心變量。
        結果不需要梯度，如果輸入是volatile，則輸出也是volatile。

        .. 註意::
          返回變量使用與原始變量相同的數據張量，並且可以看到其中任何一個的就地修改，並且可能會觸發正確性檢查中的錯誤。
        """
        result = NoGrad()(self)  # this is needed, because it merges version counters
        result._grad_fn = None
        return result

    def detach_(self):
        """從創建它的圖中分離出變量並作為該圖的一個葉子"""
        self._grad_fn = None
        self.requires_grad = False

    def retain_grad(self):
        """Enables .grad attribute for non-leaf Variables."""
        if self.grad_fn is None:  # no-op for leaves
            return
        if not self.requires_grad:
            raise RuntimeError("can‘t retain_grad on Variable that has requires_grad=False")
        if hasattr(self, ‘retains_grad‘):
            return
        weak_self = weakref.ref(self)

        def retain_grad_hook(grad):
            var = weak_self()
            if var is None:
                return
            if var._grad is None:
                var._grad = grad.clone()
            else:
                var._grad = var._grad + grad

        self.register_hook(retain_grad_hook)
        self.retains_grad = True

二、Variable類和計算圖

簡單的建立一個計算圖，便於理解幾個相關知識點：

requires_grad參數：是否要求導數，默認False，葉節點指定True後，依賴節點都被置為True
.backward()方法：根Variable的方法會反向求解葉Variable的梯度
.backward()方法grad_variable參數：形狀與根Variable一致，非標量Variable反向傳播方向指定
葉節點：由用戶創建的計算圖Variable對象，反向傳播後會保留梯度grad數值，其他Variable會清空為None
grad_fn屬性：指向創建Tensor的Function，如果某一個對象由用戶創建，則指向None

import torch as t
from torch.autograd import Variable as V

a = V(t.ones(3,4),requires_grad=True)
b = V(t.zeros(3,4))
c = a.add(b)
d = c.sum()
d.backward()

# 雖然沒有要求cd的梯度，但是cd依賴於a，所以a要求求導則cd梯度屬性會被默認置為True
print(a.requires_grad, b.requires_grad, c.requires_grad,d.requires_grad)
# 葉節點(由用戶創建)的grad_fn指向None
print(a.is_leaf, b.is_leaf, c.is_leaf,d.is_leaf)
# 中間節點雖然要求求梯度，但是由於不是葉節點，其梯度不會保留，所以仍然是None
print(a.grad,b.grad,c.grad,d.grad)

True False True True
True True False False
Variable containing:
 1  1  1  1
 1  1  1  1
 1  1  1  1
[torch.FloatTensor of size 3x4]
 None None None

模擬一個簡單的反向傳播：

def f(x):
    """x^2 * e^x"""
    y = x**2 * t.exp(x)
    return y

def gradf(x):
    """2*x*e^x + x^2*e^x"""
    dx = 2*x*t.exp(x) + x**2*t.exp(x)
    return dx

x = V(t.randn(3,4), requires_grad=True)
y = f(x)
y.backward(t.ones(y.size()))
print(x.grad)
print(gradf(x))

Variable containing:
 -0.3315   3.5068  -0.1079  -0.4308
 -0.1202  -0.4529  -0.1873   0.6514
  0.2343   0.1050   0.1223  15.9192
[torch.FloatTensor of size 3x4]

Variable containing:
 -0.3315   3.5068  -0.1079  -0.4308
 -0.1202  -0.4529  -0.1873   0.6514
  0.2343   0.1050   0.1223  15.9192
[torch.FloatTensor of size 3x4]

結果一致。

『PyTorch』第五彈_深入理解autograd_上：Variable

ogr runt 無需 nbsp 移除數值 port auto hasattr 一、Variable類源碼簡介 class Variable(_C._VariableBase): """ Attributes: data: 任意類型的封

『PyTorch』第五彈_深入理解autograd_下：Variable梯度探究

def int 用法 req 就是 gpo size ble 節點查看非葉節點梯度的兩種方法在反向傳播過程中非葉子節點的導數計算完之後即被清空。若想查看這些變量的梯度，有兩種方法：使用autograd.grad函數使用hook autograd.grad和ho

『PyTorch』第五彈_深入理解autograd_下：函數擴展&高階導數

return turn 都是誤差 log inpu 能夠 () 是否一、封裝新的PyTorch函數繼承Function類 forward：輸入Variable->中間計算Tensor->輸出Variable backward：均使用Variable 線性映

『PyTorch』第五彈_深入理解Tensor對象_中上：索引

nbsp 使用 gpo 簡單深入理解 pre 需要 sub ext 一、普通索引示例 a = t.Tensor(4,5) print(a) print(a[0:1,:2]) print(a[0,:2]) # 註意和前一種索引出來的值相同，shape不同 print(

『PyTorch』第五彈_深入理解Tensor對象_中下：數學計算以及numpy比較

python 輸入簡單相對 range pri std lin block 一、簡單數學操作 1、逐元素操作 t.clamp(a,min=2,max=4)近似於tf.clip_by_value(A, min, max),修剪值域。 a = t.arange(0,6).

『PyTorch』第六彈_最小二乘法的不同實現手段(待續)

int pri back imp python return red 最小 num PyTorch的Variable import torch as t from torch.autograd import Variable as V import matplotlib.

『PyTorch』第十彈_循環神經網絡

() rom tac stack 區別 div .com and tput 『cs231n』作業3問題1選講_通過代碼理解RNN&圖像標註訓練對於torch中的RNN相關類，有原始和原始Cell之分，其中RNN和RNNCell層的區別在於前者一次能夠處理整個序列，

『MXNet』第五彈_多GPU並行程序設計

計算模型 line lam 裏的完整 .so doc params 對象資料原文一、概述思路假設一臺機器上有k個GPU。給定需要訓練的模型，每個GPU將分別獨立維護一份完整的模型參數。在模型訓練的任意一次叠代中，給定一個小批量，我們將該批量中的樣本劃分成k份

『PyTorch』第七彈_nn.Module擴展層

計數 area 除了直觀 .mm 而不是回收 mod div 有下面代碼可以看出torch層函數(nn.Module)用法，使用超參數實例化層函數類(常位於網絡class的__init__中)，而網絡class實際上就是一個高級的遞歸的nn.Module的class。

『MXNet』第六彈_數據處理API（待續）

convert lena PE color bus AS array 維度 shuff 一、Gluon數據加載圖片數據(含標簽)加載函數：gluon.data.vision.ImageFolderDataset 給出ImageFolderDataset類的描述，

『MXNet』第七彈_分類器demo示意

padding NPU output nump class tensor rac 檢測 HA 解壓文件命令： with zipfile.ZipFile(‘../data/kaggle_cifar10/‘ + fin, ‘r‘) as zin:

『MXNet』第八彈_物體檢測之SSD

out can RR AS upd 全部 ask 類別 clu 預、API介紹 mxnet.metric from mxnet import metric cls_metric = metric.Accuracy() box_metric = metric.

『PyTorch』第十四彈_torch.nn.Module深入分析

dict html body als linear ogr highlight 9.1 htm nn.Module基類的構造函數： def __init__(self): self._parameters = OrderedDict() self._mo

『PyTorch』第十二彈_nn.Module和nn.functional

python 需要能夠學習 .com 測試 true brush randn 大部分nn中的層class都有nn.function對應，其區別是： nn.Module實現的layer是由class Layer(nn.Module)定義的特殊類，會自動提取可學習參數nn

『PyTorch』第二彈_張量

ref play spl rip 出錯 margin logs 互轉演示參考：http://www.jianshu.com/p/5ae644748f21# 幾個數學概念：標量（Scalar）是只有大小，沒有方向的量，如1，2，3等向量（Vector）是有大小和方向的

『流暢的Python』第9章_對象

form 大量 ash 名稱 format spa ots 數字 3.1 一、Python風格以一個二元素向量對象為例 import math from array import array class Vector2d: typecode

『Python資料分析與挖掘實戰』第五章：挖掘建模

# coding:utf-8 """ logistic 迴歸，自動建模 """ import pandas as pd # 引數初始化 filename = r"C:\learning\DataMining\Book\Python_DataMining\Data\cha

『TensorFlow』徒手裝高達_初號機_添加訓練模組並整合為可用分類網絡

正則 basename eth enum 結構 __name__ 第一個 sce 選擇摘要：本次整合了前面兩節的模組，並添加向前傳播&反饋訓練部分，使之成為一個包含訓練&驗證&測試的分類網絡。文件架構：代碼整合： image_info.py

『TensorFlow』徒手裝高達_戰鬥數據收集模塊原型_save&restore

inf jpg dai rand port logs float code 模塊順便一提，上節定義的網絡結構有問題，現已修改，之後會陸續整理上來。兩種常用（我會的）的加載方式：1. ‘‘‘ 使用原網絡保存的模型加載到自己重新定義的圖上可以使用python變量名加載模型

『python』科學計算專項_科學繪圖庫matplotlib學習之繪制動畫（待續）

同時 func 動作 .com block save init [] first 示例代碼簡單調用繪圖 from matplotlib import pyplot as plt import matplotlib.animation as animation impor

『PyTorch』第五彈_深入理解autograd_上：Variable

一、Variable類源碼簡介

二、Variable類和計算圖

相關推薦