【Gans入門】Pytorch實現Gans程式碼詳解【70+程式碼】

阿新 • • 發佈：2018-12-19

簡述

由於科技論文老師要求閱讀Gans論文並在網上找到類似的程式碼來學習。

程式碼來源

程式碼含義概覽

這個大致講講這個程式碼實現了什麼。

這個模型的輸入為：一些資料夾雜在 $x^2$ 和 $2x^2+1$ 這個兩個函式之間的一些資料。這個用線性函式的隨機生成來生成這個東西
輸出： 這是一個生成模型，生成模型的結果就是生成通過上面的輸入資料輸出這樣的資料來畫一條曲線

我們每次只取15個在x方向上等距的點。然後畫出這條曲線來。
經過學習之後，我們要求這個模型能自己畫出一條在其中的曲線來。
當然，由於我們設定的區間是有弧線的，即區間的概率上是有偏差的。經過足夠多的擬合，有較高的概率使得整個模型畫出來的曲線也是一個弧線。

程式碼分段解釋

匯入包：

import torch
import torch.nn as nn
import numpy as np
import matplotlib.pyplot as plt

設定引數：

LR_G：生成器的學習率
LR_D：判別器的學習率
N_IDEAS：生成器的啟發因子（就是生成器這個神經網路的初始輸入層的節點數）
ART_COMPONENTS：觀測節點–每次用於畫線的那些輸出點的數量
BATCH_SIZE：其實是輸入資料的數量。
PAINT_POINTS ：就是把重複的那麼多資料（將x區間等分為觀測節點數量等分的x節點）疊起來而已。這樣之後就直接代入就可以知道資料了。

BATCH_SIZE = 64
LR_G = 0.0001  # learning rate for generator
LR_D = 0.0001  # learning rate for discriminator
N_IDEAS = 5  # think of this as number of ideas for generating an art work (Generator)
ART_COMPONENTS = 15  # it could be total point G can draw in the canvas
PAINT_POINTS = np.vstack([np.linspace( 
-1, 1, ART_COMPONENTS) for _ in range(BATCH_SIZE)])

給出標準資料：

這個函式，會給出特定規模的標準資料

先建立一個（BATCH_SIZE,1）規模的來自於（1,2）均勻分佈的隨機數。
再用這個資料構建 $a*x ^2 + (a - 1)$ 其中a來自於 $(1,2)$ 的均勻分佈。然後有BATCH_SIZE 個結果，所以，我們會在前面說到，這個引數表示輸入集合的大小

def artist_works():  # painting from the famous artist (real target)
    a = np.random.uniform(1, 2, size=BATCH_SIZE)[:, np.newaxis]
    paintings = a * np.power(PAINT_POINTS, 2) + (a - 1)
    paintings = torch.from_numpy(paintings).float()
    return paintings

構建模型：

搭建神經網路

這裡搭建的神經網路，只需要構建對映層就好了。
生成器模型：先通過一個線性函式構建一個從N_IDEAS到128的對映。再通過啟用函式ReLU()函式來做一個對映。最後，再用一個線性函式搭建從128到觀測點的對映。（這些對映都是用矩陣乘法來實現的，所以，其實引數空間是三個不同的矩陣）
判別式模型：先通過一個觀測點的到128的模型。再通過一個ReLU啟用函式。之後，再用一個線性函式使得從128到1維度。一維就是常數，再做一個sigmoid的啟用函式對映到 $(0,1)$ 空間。表示概率。

G = nn.Sequential(  # Generator
    nn.Linear(N_IDEAS, 128),  # random ideas (could from normal distribution)
    nn.ReLU(),
    nn.Linear(128, ART_COMPONENTS),  # making a painting from these random ideas
)

D = nn.Sequential(  # Discriminator
    nn.Linear(ART_COMPONENTS, 128),  # receive art work either from the famous artist or a newbie like G
    nn.ReLU(),
    nn.Linear(128, 1),
    nn.Sigmoid(),  # tell the probability that the art work is made by artist
)

構建優化器

opt_D = torch.optim.Adam(D.parameters(), lr=LR_D)
opt_G = torch.optim.Adam(G.parameters(), lr=LR_G)

構建了兩個優化器。其實就是把對應模型的引數放進來了而已，之後，再設定一下學習率。

這裡採用的是Adam模型來做優化。

迭代細節

其實這上面應該還有一些畫圖而加上的函式，但是對於模型不是很重要，這裡就不看了。最後會有一個整體的模型。

for step in range(10000):

明顯看出，使用了10000次的迭代。

先呼叫標準資料生成函式，生成標準資料。
再用pytorch的隨機數來生特定大小的生成器啟發因子。
之後，再把這個隨機數丟給生成器。
明顯，通過這樣的訓練，其實逐漸的訓練這個生成器模型，在隨機給輸入的情況下，漸漸掌握輸出正確的結果（個人感覺這裡有提高的可能）

artist_paintings = artist_works()  # real painting from artist
G_ideas = torch.randn(BATCH_SIZE, N_IDEAS)  # random ideas
G_paintings = G(G_ideas)  # fake painting from G (random ideas)

再把假畫和真畫都丟給判別式模型。給出一個概率來。

之後構建兩個模型的交叉熵，需要降低的損失函式

D_loss = - torch.mean(torch.log(prob_artist0) + torch.log(1. - prob_artist1))
G_loss = torch.mean(torch.log(1. - prob_artist1))

這個其實是根據論文中的公式給出的。

注意到，這裡跟下面演算法中給出的梯度是相同的。就是前面少了個係數，但是有沒係數，對於這個不影響的。

在這裡插入圖片描述

其實上面只是把整個模型搭建起來，其實都還沒有執行的。
真正執行的部分是下面這裡

opt_D.zero_grad()
D_loss.backward(retain_graph=True)  # reusing computational graph
opt_D.step()

opt_G.zero_grad()
G_loss.backward(retain_graph=True)
opt_G.step()

注意到，其實非常重複的。

第一步的zero_grad()函式：

原因：
In PyTorch, we need to set the gradients to zero before starting to do backpropragation because PyTorch accumulates the gradients on subsequent backward passes. This is convenient while training RNNs. So, the default action is to accumulate the gradients on every loss.backward() call.
在PyTorch中，我們需要設定這個梯度到0,在開始反向傳播的訓練之前，因為Pytorch會累積這個梯度在之後的反向傳播過程中。這是非常方便的當訓練RNNs的時候，所以預設就這麼設定了。
Because of this, when you start your training loop, ideally you should zero out the gradients so that you do the parameter update correctly. Else the gradient would point in some other directions than the intended direction towards the minimum (or maximum, in case of maximization objectives).
由於這個，當你開始你的訓練迴圈的時候，比較聰明的一點就是先把這個梯度設定為0，以確保你的訓練的引數會是正確的。否則的話，這個梯度會指向一些其他地方（亂跑）

第二步：反向傳播，這裡設定保留整個圖的情況下。
第三步：.step() 其實這個函式才真正表示這個模型被訓練了。

畫圖

由於我們每次生成時候後，其實都是生成了一個BATCH_SIZE個。但是我們一次畫太多的圖的話，會顯得很醜，所以就只畫第一個圖就好了。

這裡取模的原因就在於避免畫太多的圖，導致耗費太多資源。

    if step % 500 == 0:  # plotting
        plt.cla()
        plt.plot(PAINT_POINTS[0], G_paintings.data.numpy()[0], c='#4AD631', lw=3, label='Generated painting', )
        # 2x^2 + 1
        plt.plot(PAINT_POINTS[0], 2 * np.power(PAINT_POINTS[0], 2) + 1, c='#74BCFF', lw=3, label='upper bound')
        # x^2
        plt.plot(PAINT_POINTS[0], 1 * np.power(PAINT_POINTS[0], 2) + 0, c='#FF9359', lw=3, label='lower bound')
        plt.text(-.5, 2.3, 'D accuracy=%.2f (0.5 for D to converge)' % prob_artist0.data.numpy().mean(),
                 fontdict={'size': 13})
        plt.text(-.5, 2, 'D score= %.2f (-1.38 for G to converge)' % -D_loss.data.numpy(), fontdict={'size': 13})
        plt.ylim((0, 3))
        plt.legend(loc='upper right', fontsize=10)
        plt.draw()
        plt.pause(0.01)

全部程式碼：

import torch
import torch.nn as nn
import numpy as np
import matplotlib.pyplot as plt

# Hyper Parameters
BATCH_SIZE = 64
LR_G = 0.0001  # learning rate for generator
LR_D = 0.0001  # learning rate for discriminator
N_IDEAS = 5  # think of this as number of ideas for generating an art work (Generator)
ART_COMPONENTS = 15  # it could be total point G can draw in the canvas
PAINT_POINTS = np.vstack([np.linspace(-1, 1, ART_COMPONENTS) for _ in range(BATCH_SIZE)])


def artist_works():  # painting from the famous artist (real target)
    a = np.random.uniform(1, 2, size=BATCH_SIZE)[:, np.newaxis]
    paintings = a * np.power(PAINT_POINTS, 2) + (a - 1)
    paintings = torch.from_numpy(paintings).float()
    return paintings


G = nn.Sequential(  # Generator
    nn.Linear(N_IDEAS, 128),  # random ideas (could from normal distribution)
    nn.ReLU(),
    nn.Linear(128, ART_COMPONENTS),  # making a painting from these random ideas
)

D = nn.Sequential(  # Discriminator
    nn.Linear(ART_COMPONENTS, 128),  # receive art work either from the famous artist or a newbie like G
    nn.ReLU(),
    nn.Linear(128, 1),
    nn.Sigmoid(),  # tell the probability that the art work is made by artist
)

opt_D = torch.optim.Adam(D.parameters(), lr=LR_D)
opt_G = torch.optim.Adam(G.parameters(), lr=LR_G)

plt.ion()  # something about continuous plotting

for step in range(10000):
    artist_paintings = artist_works()  # real painting from artist
    G_ideas = torch.randn(BATCH_SIZE, N_IDEAS)  # random ideas
    G_paintings = G(G_ideas)  # fake painting from G (random ideas)

    prob_artist0 = D(artist_paintings)  # D try to increase this prob
    prob_artist1 = D(G_paintings)  # D try to reduce this prob

    D_loss = - torch.mean(torch.log(prob_artist0) + torch.log(1. - prob_artist1))
    G_loss = torch.mean(torch.log(1. - prob_artist1))

    opt_D.zero_grad()
    D_loss.backward(retain_graph=True)  # reusing computational graph
    opt_D.step()

    opt_G.zero_grad()
    G_loss.backward(retain_graph=True)
    opt_G.step()

    if step % 500 == 0:  # plotting
        plt.cla()
        plt.plot(PAINT_POINTS[0], G_paintings.data.numpy()[0], c='#4AD631', lw=3, label='Generated painting', )
        # 2x^2 + 1
        plt.plot(PAINT_POINTS[0], 2 * np.power(PAINT_POINTS[0], 2) + 1, c='#74BCFF', lw=3, label='upper bound')
        # x^2
        plt.plot(PAINT_POINTS[0], 1 * np.power(PAINT_POINTS[0], 2) + 0, c='#FF9359', lw=3, label='lower bound')
        plt.text(-.5, 2.3, 'D accuracy=%.2f (0.5 for D to converge)' % prob_artist0.data.numpy().mean(),
                 fontdict={'size': 13})
        plt.text(-.5, 2, 'D score= %.2f (-1.38 for G to converge)' % -D_loss.data.numpy(), fontdict={'size': 13})
        plt.ylim((0, 3))
        plt.legend(loc='upper right', fontsize=10)
        plt.draw()
        plt.pause(0.01)

plt.ioff()
plt.show()

參考並學習的連結

【Gans入門】Pytorch實現Gans程式碼詳解【70+程式碼】

簡述由於科技論文老師要求閱讀Gans論文並在網上找到類似的程式碼來學習。程式碼來源程式碼含義概覽這個大致講講這個程式碼實現了什麼。這個模型的輸入為：一些資料夾雜在x2x^2x2和2x2+12x^2+12x2+1這個兩個函式之間的一些資料。這個用線性

【專案實站】 php 實現抽獎程式碼詳解【上篇】基礎實現

基本思路：使用者生成一個隨機數，和出獎的獎品設定的隨機數比對一下。符合規則則中獎（使用者的隨機數< 獎品設定的概率值），不符則未中獎。一專案準備期，需求確認。和產品大哥一陣切磋後，認為需求1.0 //1 抽獎活動有起止時間 //2 獎品有限制個數的大獎，和不限次數的

【甘道夫】HBase基本資料操作詳解【完整版，絕對精品】

hbase(main):014:0> describe 'rd_ns:itable' DESCRIPTION

【程式碼】K-means聚類詳解及實現（Matlab聚類工具箱和自己實現）

一. 聚類先說說聚類。顧名思義，就是有一團資料，根據某種準則把相似的資料分別聚在一起，形成不同的類別（每個類別稱為一簇）。聚類是一種無監督的演算法。所謂無監督就是說，雖然聚類把物體分類到了不同的簇，只能知道哪些資料是屬於同一類的，至於這一類資料到底是什麼，並不知道。

NavigationViewDemo【和DrawerLayout搭配使用實現側滑導航視圖界面】

【第5篇】TypeScript塊module的案例程式碼詳解

https://blog.csdn.net/jilongliang/article/details/47355263 6.1分多個ts檔案實現module塊 Validation.ts程式碼 module Validation{

【C#】之七層登入程式碼詳解

前言　　之前我有寫過一篇三層登入，應用三層，將介面處理、業務邏輯處理和資料訪問分別開來，能夠很好的減少登入系統中各個模組之間的耦合度，使的系統更加可維護、可複用和可擴充套件。而七層登入是在三層基礎之上的更完美的改進，他除了主三層中有的UI層、BLL層、DAL層和Enitity層（實

【Java入門提高篇】Day34 Java容器類詳解（十五）WeakHashMap詳解

public class WeakHashMapTest { public static void main(String[] args){ testWeakHashMap(); } private static void testWeakHashMap

【TensorFlow】TFRecord資料集的製作：讀取、顯示及程式碼詳解

在跑通了官網的mnist和cifar10資料之後，筆者嘗試著製作自己的資料集，並儲存，讀入，顯示。 TensorFlow可以支援cifar10的資料格式，也提供了標準的TFRecord 格式。 tensorflow 讀取資料，官網提供了以下三種方法： 1 Feeding：在

【第9篇】TypeScript宣告合併Merging 案例程式碼詳解

10.1合併interface使用 /** * Merging Interfaces * 合併介面.. * 最簡單的，也許是最常見的，型別宣告合併是合併介面。將兩個相同的介面合併在一塊.

Spring入門詳解【基礎掃盲】

Spring基礎介紹什麼是Spring、Strust、Hibernate struts 是 web 框架(jsp/action/actionfrom) hibernate 是 orm框架,處於持久層. spring 是容器框架,用於配置bean,並

【資料結構樹表的查詢】二叉排序樹詳解和程式碼（生成、插入、查詢、最大值、最小值、刪除、中序遍歷、銷燬）

二叉排序樹（簡稱BST）又稱二叉查詢（搜尋）樹，其定義為：二叉排序樹或者是空樹，或者是滿足如下性質的二叉樹：（1）若它的左子樹非空，則左子樹上所有記錄的值均小於根記錄的值；（2）若它的右子樹非空,則右子樹上所有記錄的值均大於根記錄的值；

【H.264/AVC視訊編解碼技術詳解】十五、H.264的變換編碼（二）：H.264整數變換和量化的實現

《H.264/AVC視訊編解碼技術詳解》視訊教程已經在“CSDN學院”上線，視訊中詳述了H.264的背景、標準協議和實現，並通過一個實戰工程的形式對H.264的標準進行解析和實現，歡迎觀看！ “紙上得來終覺淺，絕知此事要躬行”，只有自己按照標準文件以程式碼

【TensorFlow】理解tf.nn.conv2d方法 ( 附程式碼詳解註釋 )

最近在研究學習TensorFlow，在做識別手寫數字的demo時，遇到了tf.nn.conv2d這個方法，查閱了官網的API 發現講得比較簡略，還是沒理解。google了一下，參考了網上一些朋友寫得部落格，結合自己的理解，差不多整明白了。方法定義 tf.nn.

PyTorch深度學習框架入門——使用PyTorch實現手寫數字識別

本文你將會了解到1、如何使用PyTorch對資料集進行匯入 2、如何使用PyTorch搭建一個簡

二維碼掃碼登入詳解【附簡易例項程式碼(html+php+ios)】

1.前言我們在寫一個不太瞭解的新功能的時候，又穩又快的一個方法就是借(chao)鑑(xi)其他的人的實現方法。所以我們先不急著開始寫程式碼，先看一下各網際網路巨頭都是如何實現的。首先來看一下淘寶的掃碼登入: F12調出控制檯，

【轉】SignalR新手系列教程詳解（七）- SignalR 瀏覽器聊天室示例程式碼分析

SignalR 瀏覽器聊天室示例程式碼分析在上一篇教程中的程式碼我們主要實現SignalR開發中的兩個基本任務：建立服務端的 hub 類作為伺服器的協調，然後就是使用 SignalR jQuery 庫來收發資訊。 SignalR Hubs 在前面的示例的Cha

【小白學PyTorch】21 Keras的API詳解（上）卷積、啟用、初始化、正則

【新聞】：機器學習煉丹術的粉絲的人工智慧交流群已經建立，目前有目標檢測、醫學影象、時間序列等多個目標為技術學習的分群和水群嘮嗑答疑解惑的總群，歡迎大家加煉丹兄為好友，加入煉丹協會。微信：cyx645016617. 參考目錄： [TOC] 我們對Keras應該已經有了一個直觀、巨集觀的認識了。現在，我們來系

【小白學PyTorch】21 Keras的API詳解（下）池化、Normalization層

文章來自微信公眾號：【機器學習煉丹術】。作者WX：cyx645016617. 參考目錄： [toc] 下篇的內容中，主要講解這些內容： - 四個的池化層； - 兩個Normalization層; ## 1 池化層和卷積層相對應，每一種池化層都有```1D,2D,3D```三種類型，這裡主要介紹2D處理影象

Eclipse中的BuildPath詳解【轉載】

sdn libraries 依賴源代碼 title 打開低版本代碼功能什麽是Build Path? Build Path是指定Java工程所包含的資源屬性集合。在一個成熟的Java工程中，不僅僅有自己編寫的源代碼，還需要引用系統運行庫（JRE）、第三方的功能擴展

【Gans入門】Pytorch實現Gans程式碼詳解【70+程式碼】

簡述

程式碼來源

程式碼含義概覽

程式碼分段解釋

匯入包：

設定引數：

給出標準資料：

構建模型：

構建優化器

迭代細節

畫圖

全部程式碼：

參考並學習的連結

相關推薦