機器學習pytorch平臺程式碼學習筆記（8）——優化器 Optimizer

阿新 • • 發佈：2019-01-07

用Spyder中如果有列舉enumerate都要在程式碼開始的地方加

if __name__ == '__main__':

原因參考連結最後：https://blog.csdn.net/u010327061/article/details/80218836

以下包括以下幾種模式:

Stochastic Gradient Descent (SGD) 比較基礎
Momentum
RMSProp

Adam

1. 引入庫

import torch
import torch.utils.data as Data
import torch.nn.functional as F
from torch.autograd import Variable
import matplotlib.pyplot as plt

2.初始化超引數

torch.manual_seed(1)    # reproducible
#超引數一般大寫：
LR = 0.01
BATCH_SIZE = 32
EPOCH = 12

3.製造偽資料

# fake dataset 資料
x = torch.unsqueeze(torch.linspace(-1, 1, 1000), dim=1) 
y = x.pow(2) + 0.1*torch.normal(torch.zeros(*x.size()))

4.顯示一下偽資料

plt.scatter(x.numpy(), y.numpy())
plt.show()

5. 先轉換成 torch 能識別的 Dataset 把資料放入資料庫

# 使用上節內容提到的 data loader， loader使訓練變成小批。 把 dataset 放入 DataLoader  
torch_dataset = Data.TensorDataset(data_tensor=x, target_tensor=y)
loader = Data.DataLoader(dataset=torch_dataset, batch_size=BATCH_SIZE, shuffle=True, num_workers=2,)

6,每個優化器優化一個神經網路

為了對比每一種優化器, 我們給他們各自建立一個神經網路, 但這個神經網路都來自同一個 Net 形式.

# 預設的 network 形式
class Net(torch.nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.hidden = torch.nn.Linear(1, 20)   # hidden layer
        self.predict = torch.nn.Linear(20, 1)   # output layer

    def forward(self, x):
        x = F.relu(self.hidden(x))      # activation function for hidden layer
        x = self.predict(x)             # linear output
        return x

# 為每個優化器建立一個 net
net_SGD         = Net()
net_Momentum    = Net()
net_RMSprop     = Net()
net_Adam        = Net()
nets = [net_SGD, net_Momentum, net_RMSprop, net_Adam]#放在list裡面，可以用個for迴圈遍歷

7.優化器 Optimizer

接下來在建立不同的優化器, 用來訓練不同的網路. 並建立一個 loss_func 用來計算誤差. 我們用幾種常見的優化器, SGD, Momentum, RMSprop, Adam.

# different optimizers，same learning rate
opt_SGD         = torch.optim.SGD(net_SGD.parameters(), lr=LR)
opt_Momentum    = torch.optim.SGD(net_Momentum.parameters(), lr=LR, momentum=0.8) #比sgd多了一個momentum引數
opt_RMSprop     = torch.optim.RMSprop(net_RMSprop.parameters(), lr=LR, alpha=0.9)
opt_Adam        = torch.optim.Adam(net_Adam.parameters(), lr=LR, betas=(0.9, 0.99))
optimizers = [opt_SGD, opt_Momentum, opt_RMSprop, opt_Adam]#放在list裡面，可以用個for迴圈遍歷
#迴歸誤差
loss_func = torch.nn.MSELoss()
losses_his = [[], [], [], []]   # 記錄 training 時不同神經網路的 loss

8.訓練/出圖：

for epoch in range(EPOCH):
    print('Epoch: ', epoch)
    for step, (batch_x, batch_y) in enumerate(loader):
        b_x = Variable(batch_x)  # 務必要用 Variable 包一下，之前傳進來的是Tensor的形式，需要轉一下
        b_y = Variable(batch_y)

        # 對每個優化器, 優化屬於他的神經網路
        for net, opt, l_his in zip(nets, optimizers, losses_his):#三個都是list形式zip打包處理
            output = net(b_x)              # get output for every net
            loss = loss_func(output, b_y)  # compute loss for every net
            opt.zero_grad()                # clear gradients for next train
            loss.backward()                # backpropagation, compute gradients
            opt.step()                     # apply gradients
            l_his.append(loss.data[0])     # loss recoder

9.列印：

   
    labels = ['SGD','Momentum','RMSprop','Adam']
    for i, l_his in enumerate(losses_his):
        plt.plot(l_his,label=labels[i])
    plt.legend(loc='best')
    plt.xlabel('Steps')
    plt.ylabel('Loss')
    plt.ylim(0,0.2)
    plt.show()

10.結果

參考連結：

https://morvanzhou.github.io/tutorials/machine-learning/torch/3-06-optimizer/

機器學習pytorch平臺程式碼學習筆記（8）——優化器 Optimizer

用Spyder中如果有列舉enumerate都要在程式碼開始的地方加if __name__ == '__main__': 原因參考連結最後：https://blog.csdn.net/u010327061/article/details/80218836以下包括以下幾種模式

莫煩大大TensorFlow學習筆記（5）----優化器

一、TensorFlow中的優化器 tf.train.GradientDescentOptimizer：tf.train.AdadeltaOptimizertf.train.AdagradOptimizertf.train.AdagradDAOptimizertf.train.MomentumOptimiz

【機器學習】TensorFlow （二）優化器Optimizer

昨天整理了一下梯度下降演算法及其優化演算法，傳送門：https://blog.csdn.net/zxfhahaha/article/details/81385130 那麼在實戰中我們如何用到這些優化器，今天就整理一下TensorFlow中關於優化器Optimi

機器學習筆記（二）——分類器之優缺點分析

原始資料中存在著大量不完整、不一致、有異常的資料，須進行資料清洗。資料清洗主要是刪除原始資料集中的無關資料、重複資料，平滑噪聲資料，篩選掉與挖掘主題無關的資料，處理缺失值、異常值。一、線性分類器： f=w^T+b / logistic regression 學習方

特徵工程和模型融合--機器學習--思維導圖和筆記（29）

一、思維導圖（點選圖方法）二、補充筆記（1）常見的特徵工程主要指對各種型別的特徵進行處理，包括數值型特徵、類別型特徵、時間型特徵和其他型別特徵和組合特徵。對於數值型特徵，可以進行幅度調整（包括min-max縮放、標準化、歸一化）、統計值分析（最大值、最小值、平

Swift學習筆記（8）：枚舉

check oss 函數 not 條形碼 blog 出現現在 pan 目錄：基本語法關聯值原始值枚舉為一組相關的值定義了一個共同的類型。 ?可以給枚舉成員指定原始值類型：字符串，字符，整型值或浮點數等 ?枚舉成員可以指定任意類型的關聯值存儲

struts2學習筆記（8）-------struts2的ajax支持

net fcm utf-8 asc uri () nal extends keyword struts2支持一種stream類型的Result，這樣的類型的Result能夠直接向client瀏覽器響應二進制，文本等。我們能夠再

學習正則表達式筆記（二）

括號之間都沒有分組 ont dot 操作 span googl 正則匹配的各種模式 1.擇一匹配（|）　　擇一匹配用管道符號（|），也就是豎線表示。代表可以從多個模式中選擇一個，可用於分割正則表達式。例如： ABC | abc 表示即可以匹配 ABC，又可以匹配 a

QT學習筆記（14）定時器類DTimer的使用

fin isa play htm number conn stat alt .cn 一、　　在前面的學習筆記中，我們已經學習定時器事件http://www.cnblogs.com/blog-ccs/p/7445323.html 　　現在，我們學習QTimer定時器類，比較

Linux學習筆記（8）

8一、文件或目錄權限chmodrw- r-- r-- 。——— ——— ——— ——所有者所屬組其他人受selinux限制r可讀=4 w可寫=2 x可執行=1chmod

Linux第二周學習筆記（8）

意思 val 權限 zhong sof int conda 關系 rgb Linux第二周學習筆記（8）2.14 文件或目錄權限chmod （1）. 權限表示[root@daizhihong01 ~]# ls -l總用量 12-rw-------. 1 root root

匯編語言學習筆記（8）——數據處理的基本問題

byte 緩沖器表達基本操作進行能夠 ng- 尺寸 1、僅僅有“bx、si、di、 bp”四個寄存器能夠用在[…]中來進行內存單元的尋址 2、這四個寄存

Rx 學習筆記（8）錯誤處理和 To 操作符

con 錯誤處理操作 operator 處理 opera erro per tor Error Handling Operators Catch Retry Operators to Convert Observables ToRx 學習筆記（8）錯誤處理和 To 操作符

SRM32學習筆記（8）——ADC和DAC

補充一次說明否則 onf 允許包括特性而不是 1、ADC簡介 STM32 擁有 1~3 個 ADC（STM32F101/102 系列只有 1 個 ADC）STM32F103至少擁有2個ADC，STM32F103ZE包含3個ADC，這些 ADC

ActiveMQ學習筆記（8）----ActiveMQ的訊息儲存持久化

1. 概述　　ActiveMQ不僅支援persistent和non-persistent兩種方式，還支援訊息的恢復（recovery）方式。 2. PTP 　　Queue的儲存是很簡單的，其實就是FIFO的Queue 　　　　 2. PUB/SUB 　　對於持久化訂閱主題，每一個消費者都將獲得一

cesium 學習筆記（8）2018.11.08

實體一、各種屬性 1.id 唯一標誌，不設定的話會自動設定一個 2.name 不唯一 3.show 可見性 4.availability 可用性 5.description 描述 6.position 位置 7.orientation 方向 8.不常用的：vie

MongoDB 學習筆記（8）---$type 操作符

$type操作符是基於BSON型別來檢索集合中匹配的資料型別，並返回結果。 MongoDB 中可以使用的型別如下表所示：型別數字備註 Double 1 String 2 &n

吳恩達深度學習筆記（8）-重點-梯度下降法（Gradient Descent）

梯度下降法（Gradient Descent）（重點）梯度下降法可以做什麼？在你測試集上，通過最小化代價函式（成本函式） J(w,b) 來訓練的引數w和b ，如圖，在第二行給出和之前一樣的邏輯迴歸演算法的代價函式（成本函式）(上一篇文章已講過）梯度下降法的形象化

web前端學習（二）html學習筆記部分（8）--服務器推送事件3

tcp event tex 適用於表示前端增加 pen 傳輸 1.2.22 html5服務器推送事件 1.2.22.1 html5服務器推送事件介紹　　服務器推送事件（Server-sent Events）是HTML5規範中的一個組成部分，可以用來從服務器端實時

Go語言學習筆記（8）面向物件

package main import "fmt" func main() { //定義treeNode結構體 var root treeNode root = treeNode{value:3} fmt.Println(root) fmt.Println() root.left

機器學習pytorch平臺程式碼學習筆記（8）——優化器 Optimizer

相關推薦