用pytorch實現GAN——mnist（含有全部註釋和網路思想）

阿新 • • 發佈：2018-12-28

#coding=utf-8
import torch.autograd
import torch.nn as nn
from torch.autograd import Variable
from torchvision import transforms
from torchvision import datasets
from torchvision.utils import  save_image
import os

#建立資料夾
if not os.path.exists('./img'):
    os.mkdir('./img')

def to_img(x):
    out=0.5*(x+1)
    out=out.clamp(0,1)#Clamp函式可以將隨機變化的數值限制在一個給定的區間[min, max]內：
    out=out.view(-1,1,28,28)#view()函式作用是將一個多行的Tensor,拼接成一行
    return out

batch_size=128
num_epoch=100
z_dimension=100

#圖形啊處理過程
img_transform=transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize(mean=(0.5,0.5,0.5),std=(0.5,0.5,0.5))
])

#mnist dataset mnist資料集下載
mnist=datasets.MNIST(
    root='./data/',train=True,transform=img_transform,download=True
)

#data loader 資料載入
dataloader=torch.utils.data.DataLoader(
    dataset=mnist,batch_size=batch_size,shuffle=True
)


#定義判別器  #####Discriminator######使用多層網路來作為判別器

#將圖片28x28展開成784，然後通過多層感知器，中間經過斜率設定為0.2的LeakyReLU啟用函式，
# 最後接sigmoid啟用函式得到一個0到1之間的概率進行二分類。
class discriminator(nn.Module):
    def __init__(self):
        super(discriminator,self).__init__()
        self.dis=nn.Sequential(
            nn.Linear(784,256),#輸入特徵數為784，輸出為256
            nn.LeakyReLU(0.2),#進行非線性對映
            nn.Linear(256,256),#進行一個線性對映
            nn.LeakyReLU(0.2),
            nn.Linear(256,1),
            nn.Sigmoid()#也是一個啟用函式，二分類問題中，
            # sigmoid可以班實數對映到【0,1】，作為概率值，
            # 多分類用softmax函式
        )
    def forward(self, x):
        x=self.dis(x)
        return x


####### 定義生成器 Generator #####
#輸入一個100維的0～1之間的高斯分佈，然後通過第一層線性變換將其對映到256維,
# 然後通過LeakyReLU啟用函式，接著進行一個線性變換，再經過一個LeakyReLU啟用函式，
# 然後經過線性變換將其變成784維，最後經過Tanh啟用函式是希望生成的假的圖片資料分佈
# 能夠在-1～1之間。
class generator(nn.Module):
    def __init__(self):
        super(generator,self).__init__()
        self.gen=nn.Sequential(
            nn.Linear(100,256),#用線性變換將輸入對映到256維
            nn.ReLU(True),#relu啟用
            nn.Linear(256,256),#線性變換
            nn.ReLU(True),#relu啟用
            nn.Linear(256,784),#線性變換
            nn.Tanh()#Tanh啟用使得生成資料分佈在【-1,1】之間
        )

    def forward(self, x):
        x=self.gen(x)
        return x

#建立物件
D=discriminator()
G=generator()
if torch.cuda.is_available():
    D=D.cuda()
    G=G.cuda()



#########判別器訓練train#####################
#分為兩部分：1、真的影象判別為真；2、假的影象判別為假
#此過程中，生成器引數不斷更新

#首先需要定義loss的度量方式  （二分類的交叉熵）
#其次定義 優化函式,優化函式的學習率為0.0003
criterion = nn.BCELoss() #是單目標二分類交叉熵函式
d_optimizer=torch.optim.Adam(D.parameters(),lr=0.0003)
g_optimizer=torch.optim.Adam(G.parameters(),lr=0.0003)

###########################進入訓練##判別器的判斷過程#####################

for epoch in range(num_epoch): #進行多個epoch的訓練
    for i,(img, _) in enumerate(dataloader):
        num_img=img.size(0)
        # view()函式作用是將一個多行的Tensor,拼接成一行
        # 第一個引數是要拼接的tensor,第二個引數是-1
        # =============================訓練判別器==================
        img = img.view(num_img, -1)  # 將圖片展開為28*28=784
        real_img = Variable(img).cuda()  # 將tensor變成Variable放入計算圖中
        real_label = Variable(torch.ones(num_img)).cuda()  # 定義真實的圖片label為1
        fake_label = Variable(torch.zeros(num_img)).cuda()  # 定義假的圖片的label為0

        # 計算真實圖片的損失
        real_out = D(real_img)  # 將真實圖片放入判別器中
        d_loss_real = criterion(real_out, real_label)  # 得到真實圖片的loss
        real_scores = real_out  # 得到真實圖片的判別值，輸出的值越接近1越好

        # 計算假的圖片的損失
        z = Variable(torch.randn(num_img, z_dimension)).cuda()  # 隨機生成一些噪聲
        fake_img = G(z)  # 隨機噪聲放入生成網路中，生成一張假的圖片
        fake_out = D(fake_img)  # 判別器判斷假的圖片
        d_loss_fake = criterion(fake_out, fake_label)  # 得到假的圖片的loss
        fake_scores = fake_out  # 得到假圖片的判別值，對於判別器來說，假圖片的損失越接近0越好

        # 損失函式和優化
        d_loss = d_loss_real + d_loss_fake #損失包括判真損失和判假損失
        d_optimizer.zero_grad()  # 在反向傳播之前，先將梯度歸0
        d_loss.backward()  # 將誤差反向傳播
        d_optimizer.step()  # 更新引數

        # ==================訓練生成器============================
        ################################生成網路的訓練###############################
        # 原理：目的是希望生成的假的圖片被判別器判斷為真的圖片，
        # 在此過程中，將判別器固定，將假的圖片傳入判別器的結果與真實的label對應，
        # 反向傳播更新的引數是生成網路裡面的引數，
        # 這樣可以通過更新生成網路裡面的引數，來訓練網路，使得生成的圖片讓判別器以為是真的
        # 這樣就達到了對抗的目的

        # 計算假的圖片的損失

        z = Variable(torch.randn(num_img, z_dimension)).cuda()  # 得到隨機噪聲
        fake_img = G(z) #隨機噪聲輸入到生成器中，得到一副假的圖片
        output = D(fake_img)  # 經過判別器得到的結果
        g_loss = criterion(output, real_label)  # 得到的假的圖片與真實的圖片的label的loss

        # bp and optimize
        g_optimizer.zero_grad()  # 梯度歸0
        g_loss.backward()  # 進行反向傳播
        g_optimizer.step()  # .step()一般用在反向傳播後面,用於更新生成網路的引數

        #列印中間的損失
        if (i+1)%100==0:
            print('Epoch[{}/{}],d_loss:{:.6f},g_loss:{:.6f} '
                  'D real: {:.6f},D fake: {:.6f}'.format(
                epoch,num_epoch,d_loss.data[0],g_loss.data[0],
                real_scores.data.mean(),fake_scores.data.mean()  #列印的是真實圖片的損失均值
            ))

        if epoch==0:
            real_images=to_img(real_img.cpu().data)
            save_image(real_images, './img/real_images.png')

        fake_images = to_img(real_img.cpu().data)
        save_image(fake_images, './img/fake_images-{}.png'.format(epoch+1))
#儲存模型
torch.save(G.state_dict(),'./generator.pth')
torch.save(D.state_dict(),'./discriminator.pth')

用pytorch實現GAN——mnist（含有全部註釋和網路思想）

#coding=utf-8 import torch.autograd import torch.nn as nn from torch.autograd import Variable from torchvision import transforms from torchvision impo

七、Sketchup用ruby進行二次開發--利用Transformation實現Move工具（平移、旋轉和縮放）

在Sketchup中，move工具使用的非常廣泛，，可以移動、拉伸和複製幾何體，也可以用來旋轉元件。舉一個簡單地例子。我們要做一個建築物的尖頂，如下圖所示，就是使用move工具實現的。接下來我們就要學習如何使用ruby實現這樣的功能

使用php實現簡單爬蟲（一種通用的爬蟲思想）

概述現在爬蟲技術算是一個普遍的技術了，各個語言的爬蟲百家爭鳴，但是根據筆者自己的感覺還是python是主流。爬蟲涉及到太多的東西，筆者並不是專業的爬蟲工程師，只不過個人興趣分享一下。由於筆者是php工作，所以就使用php來進行簡單爬蟲。不過我的方法應該是很通用的，我相信java，

逆波蘭式的計算（含有數學函式和浮點數）

#include<stdio.h> #include<stdlib.h> #include<string.h> #include<math.h> #define MAX 100 #define MARK 65535 typed

用pytorch實現多層感知機（MLP)（全連線神經網路FC）分類MNIST手寫數字體的識別

1.匯入必備的包 1 import torch 2 import numpy as np 3 from torchvision.datasets import mnist 4 from torch import nn 5 from torch.autograd import Variable 6

利用pytorch實現GAN(生成對抗網路)-MNIST影象-cs231n-assignment3

Generative Adversarial Networks（生成對抗網路） In 2014, Goodfellow et al. presented a method for training generative models called Ge

用pytorch實現一個神經網路（一）

對於影象資料的resize問題： pytorch裡有幾種resize資料的方法： 1.torchvision.transforms.Resize：這個我始終沒用成，好像是伺服器上安裝的anacond

用Java實現AES加密（轉）

密鑰工具 mex 嚴格 keys 生產 ner for 創建一）什麽是AES？高級加密標準（英語：Advanced Encryption Standard，縮寫：AES），是一種區塊加密標準。這個標準用來替代原先的DES，已經被多方分析且廣為全世界所使用。那麽為什麽

用redis實現悲觀鎖（後端語言以php為例）

號碼 blank mys 時間先來 ng-click print -m 兩種 1479 鎖機制通常使用的鎖分為樂觀鎖，悲觀鎖這兩種，簡單介紹下這兩種鎖，作為本文的背景知識，對這類知識已經有足夠了解的同學可以跳過這部分。樂觀鎖先來看下百度百科上的解釋

用Websocket實現Web IM（一）

前言：最近領導要求做一版簡單的類似web版微信web IM作為其他產品的過渡，經過跟同事討論後，決定用websocket嘗試做一下（微信使用的是長輪詢保持連線）。首先要解決的是掃碼登入和重連機制問題，雖然實現起來很簡單，但是以防忘記，還是要記錄一下。一、掃碼登陸 1、二維碼

基於Pytorch實現風格遷移（CS231n assignment3）

風格遷移由Gatys等與2015年提出，論文：https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Gatys_Image_Style_Transfer_CVPR_20

【LeetCode題解】232_用棧實現隊列（Implement-Queue-using-Stacks）

復雜彈出兩個棧 art 分析完成後棧操作 all n) 目錄描述解法一：在一個棧中維持所有元素的出隊順序思路入隊（push）出隊（pop）查看隊首（peek）是否為空（empty） Java 實現 Python 實現解法二：一個棧入，一個棧出

QT 下用opencv實現影象分類（1）

一.概述 1.按影象中的內容給影象分類是計算機視覺中比較適合初學者的專案，我見過好多手機相簿都有這一個功能，比如把美食歸為一個標籤，藍天白雲歸為一個標籤等等。還有我之前做過的車牌識別的專案都用到影象分類。 2.我做這個專案的環境是QT加opencv3.2,專案在MAC上跑

用棧求迷宮問題（最短路徑和全部路徑）

這是資料結構的作業，便找書邊看網上，然後自己慢慢寫出來的,這裡面主要是回溯法。因為課本上是打印出一條路徑，然後我在想怎樣能將所有的路徑都輸出來，方法：就是當求出一條路徑後，將出口點變成可以走的點（因為之前將其值變成了-1），並且將棧頂元素出棧，還需要得到現在棧頂元素的i，j

資料結構之用棧實現迷宮問題（dfs）

給一個n*n的方格，讓你求從左上角到所給一點的任意一條路徑並輸出該題用到dfs，以下是對dfs的簡要解析：詳解請參見傳送門 dfs是一種用於遍歷或搜尋樹或圖的演算法。沿著樹的深度遍歷樹的節點，儘可能深的搜尋樹的分支。當節點v的所在邊都己被探尋過或者在搜尋時結點不

關於用Java實現傳送簡訊（部分程式碼來源於網路）

第一步：訪問中國網建SMS簡訊通網頁註冊賬號。儲存金鑰。第二步：編碼實現編寫JavaBean,定義變數phonenumber，生成get/set方法建立介面 //傳送簡訊 void send(Player player) throws Exception; //實現

一種簡單的用java實現快速排序（Quicksort）

1，快速排序（Quicksort）是對氣泡排序的一種改進。對資料量越大，資料分佈越混亂的，一般認為是效能最好的。快排是分治思想的一種體現，把大的問題細化成小問題，把小問題細化成更小的問題，最終把問題縮小到一定規模內，可解決。 2，快排演算法思路就是，先取一個數作為關鍵資料（key一般

用pytorch實現預訓練網路的finetune

繼續熟悉pytorch，發現的確比TensorFlow好用，在官網finetune教程的基礎上進行了大幅修改，主要是熟悉了pytorch自帶的Dataset和DataLoader類。 # -*- coding: utf-8 -*- import os, torch, g

手把手教你用R實現標記化（附程式碼、學習資料、語料庫）

作者：Rachael Tatman翻譯：樑傅淇本文長度為1600字，建議閱讀4分鐘標記化是自然語

用兩個棧實現隊列（劍指offer第7題）

info 一個 .com 所有有一點 bsp 都沒有我想完成用兩個棧來實現一個隊列，完成隊列的Push和Pop操作。隊列中的元素為int類型。棧的特點：先進後出隊列的特點：先進先出 push很好實現。 pop可能有一點難度。最開始兩個棧中都沒有元素，所有進隊列

用pytorch實現GAN——mnist（含有全部註釋和網路思想）

相關推薦