與判別網路對抗的生成網路 (Generative Adversarial Nets)

Generative Adversarial Nets (GAN)

主線為 Ian J. Goodfellow 的論文 (“Generative Adversarial Nets”) 內容 1。之前一些人譯為“生成式對抗網路”。但從模型分類 (生成模型和判別模型) 的角度來看，更具體地，改為“與判別網路對抗的生成網路”會比較直觀。

另外，後面的“我們”並不指我，而指“Ian J. Goodfellow”等人~

摘要

通過對抗過程來估計生成模型，該過程中同時訓練兩個模型：生成模型G獲得資料分佈，判別模型D估計訓練資料 (而不是G) 中 1 個樣本的概率。G的訓練過程為最大化D

犯錯的概率。生成模型的估計過程對應一場最小最大的雙人遊戲。任意函式G和D的空間中，存在唯一解，此時G可恢復訓練資料的分佈，而D等於12。如果G和D定義為多層感知機，那麼整個系統可通過反向傳播來訓練。訓練和樣本生成時不需要任何的 Markov 鏈或展開的近似推理網路。

1. 簡介

人工智慧應用 (諸如自然影象，語音波形和自然語言的語料庫)中會遇到各種各樣的資料，深度學習的前景是發現代表這些資料的概率分佈的豐富的分層模型。目前，深度學習最大的成功是判別模型。判別模型通常將高維的豐富的感官輸入對映為 1 個類標籤。這些成功主要歸功於反向傳播，Dropout 和使梯度表現不錯的分段線性單元。由於許多難解的概率計算 (採用最大似然估計和相關策略) 難以近似和生成上下文中的分段線性單元難以利用，深度生成

模型的影響偏小。我們提出一個新的產生模型的估計過程來回避這些困難。

對抗的網路框架中，生成模型與它的對手對決：判別模型學習去決定某個樣本是否來自模型分佈或資料分佈。生成模型可認為類似一個造假團伙，該團伙試圖製造假幣，但使用前不檢驗。而判別模型類似警察，試圖檢驗假幣。遊戲中的競爭促使雙方改進方法，直到假幣與真幣不可分為止。

該框架可為許多模型和優化方法產生具體的訓練方法。本文中，生成模型通過一個多層感知機傳遞隨機噪聲，且判別模型也是一個多層感知機。這個特例稱為對抗的網路。這裡，僅用反向傳播和 Dropout 來訓練模型，生成模型通過前向傳播來生成樣本。不需要近似推理和 Markov 鏈。

2. 相關工作

直到最近，大多數深度生成模型的工作集中於為模型的概率分佈函式指定引數。然後可最大化對數似然來訓練模型。這類模型中最成功的可能是深度 Boltzmann 機。它們一般有難解的似然函式，因此要求對似然梯度的大量近似。這些困難推動了“生成機”的發展——不用顯式表示似然的模型仍能從期望的分佈中生成樣本。隨機的生成網路正是一個用反向傳播訓練 (而不是 Boltzmann 機要求的大量近似) 的生成機。該工作進一步消除了用於隨機的生成網路的 Markov 鏈。

注：“大量近似”的原文為 numerous approximations，“數值近似”的英文為 numerical approximation。不知為何想起了這個~

利用如下觀測的生成過程來反向傳播梯度：

limδ→0∇xEϵ∼N(0,δ2I)f(x+ϵ)=∇xf(x)

我們開展工作的同時，Kingma，Welling 和 Rezende 等人提出更一般的隨機反向傳播規則，允許通過有限方差的高斯分佈來反向傳播，且對方差和均值反向傳播。這些反向傳播規則可學到生成器的條件方差 (條件方差視為我們工作的超引數) 。Kingma，Welling 和 Rezende 等人用隨機反向傳播來訓練變分自編碼器 (VAEs)。與對抗的生成網路相似，變分自編碼器為可微分的生成網路配對第2個網路。與對抗的生成網路不同的是，VAE 中的第2個網路是一個使用近似推理的識別模型。GANs 要求對可見單元微分，故不能對離散資料建模。而 VAEs 要求對隱含單元微分，因而不能對離散的潛在變數建模。存在其它類似 VAE 的方法，但與我們的方法更不相關。

以前有工作用判別標準來訓練生成模型。這些方式的標準難以用於深度生成模型上。這些方法難以近似深度模型，因為用變分近似無法近似深度模型所涉及的概率的下界。當模型用於從固定的噪聲分佈中區分資料時，噪聲對比估計 (NCE) 通過學習該模型的權重來訓練生成模型。用之前訓練好的模型作為噪聲分佈，提高了訓練一系列模型的質量。NCE 是本質上與對抗的網路遊戲中的正式競爭相似的一種非正式競爭機制。NCE 關鍵的侷限為它的“判別器”是由噪聲分佈和模型分佈的概率密度比重來定義，從而要求評估和反向傳播兩個概率密度。

一些以前的工作已用到兩個網路競爭的一般概念。最相關的工作為可預見性最小化。其中，一個訓練好的神經網路中的每個隱含單元與第2個網路的輸出不同。給定所有其它隱含單元的值，第2個網路的輸出可預測該隱含單元的數值。本文的工作與可預測性最小化有3處重要的不同：1) 本文工作中，網路間的競爭是唯一的訓練標準，足以訓練網路。可預測性最小化僅是鼓勵神經網路中隱含單元在完成其它任務的同時，統計上也相互獨立的一個正則項；競爭並不是主要的訓練標準。2) 競爭的本質不同。可預測性最小化中，兩個網路的輸出相互比較，一個網路試圖使輸出相似，而另一個網路試圖使輸出不同；輸出為標量。GANs 中，一個網路生成一個豐富的高維向量來作為另一個網路的輸入，並嘗試選擇使另一個網路不知如何判別的向量為輸入。3) 學習過程不同。可預測性最小化被描述為一個最小化目標函式的優化問題，學習去逼近目標函式的最小值。GANs 基於最大最小遊戲，而不是一個優化問題，且一個 Agent 尋求最大化值函式，另一個 Agent 尋求最小化值函式。遊戲在鞍點處終止，此處是關於一個 Agent 的策略的最小值，和關於另一個 Agent 的策略的最大值。

對抗的生成網路有時曾與“對抗的例項”相混淆。對抗的例項是指為找出與誤分類的資料相似的例項，通過在分類網路的輸入上直接基於梯度優化，來獲得的例項。對抗的例項與當前工作是不同的，因為對抗的例項不是一個生成模型的訓練機制。相反，對抗的例項主要是顯示網路行為異常 (經常以高置信度將兩幅影象分為不同類，儘管兩幅影象對人來說是同類) 的分析工具。對抗的例項的存在確實表明訓練對抗的生成網路可能效率低，因為對抗的例項表明，在不模仿某類的人類感知屬性時，使目前的判別網路自信地識別該類是可能的。

3. 對抗的網路

當模型都為多層感知機時，可非常直接地應用對抗的模型框架。已知資料x，為學習產生器的概率分佈pg，定義輸入噪聲變數pz(z)的先驗，然後表示資料空間的對映為G(z;θg)，其中G為一個用引數θg的多層感知機表示的可微函式。同時定義第 2 個輸出為單個標量的多層感知機D(x;θd)。D(x)為來自資料 (而不是pg)的x的概率。訓練D來最大化為訓練例項和來自G的生成樣本分配正確標籤的概率；同時，訓練G來最小化log(1−D(G(z)))。換句話說，D和G根據值函式V(G,D)來進行雙人的最小最大遊戲：

minGmaxDV(G,D)=Ex∼pdata(x)[logD(x)]+Ez∼pz(z)[log(1−D(G(z)))]256(1)

對抗的網路的理論分析本質上證明，效能足夠好時 (即無引數限制) ，訓練標準可恢復生成資料的分佈來作為G和D。下圖為該方法非正式的卻更直觀的解釋。

訓練對抗的生成網路時，同時更新判別分佈 (D，藍色虛線) 使D能區分資料生成分佈 (黑色虛線) 中的樣本和生成分佈pg (G，綠色實線) 中的樣本。下面的水平線為均勻取樣z的區間，上面的水平線為x的部分割槽間。朝上的箭頭顯示對映x=G(z)如何在轉換後的樣本上新增非均勻分佈pg。G在pg高密度區域收縮，且在pg的低密度區域擴散。
(a) 考慮一個接近收斂的對抗的模型對：pg與pd

相關推薦

一文讀懂對抗生成學習(Generative Adversarial Nets)[GAN]

一文讀懂對抗生成學習(Generative Adversarial Nets)[GAN] 0x00 推薦論文 https://arxiv.org/pdf/1406.2661.pdf 0x01什麼是gan Generative model G用來生成樣本 Discriminative mo

與判別網路對抗的生成網路 (Generative Adversarial Nets)

Generative Adversarial Nets (GAN) 主線為 Ian J. Goodfellow 的論文 (“Generative Adversarial Nets”) 內容 1。之前一些人譯為“生成式對抗網路”。但從模型分類 (生成模型和

【GAN ZOO閱讀】Generative Adversarial Nets 生成對抗網路原文翻譯 by zk

Ian J. Goodfellow, Jean Pouget-Abadie ∗ , Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair † , Aaron Courville, Yoshua Bengio ‡

快速上手生成對抗生成網路生成手寫數字集（直接上程式碼以及詳細註釋，親測可用）

這裡插入幾張模型生成的圖片，從左到右分別是隨機生成的圖片，100輪之後的圖片，2000輪之後的圖片，8000輪之後的圖片。程式碼雖然有100多行，但註釋大概佔了一般左右。一起交流，一起進步！ import tensorflow as tf from matplotlib import

2018.11.14——對抗生成網路（GAN）

用途：用生成對抗網路生成圖片原理：兩位博弈方分別由生成式模型（generative model）和判別模型充當（discriminative model）。生成模型G捕捉樣本資料的分佈，用服從某一分佈（均勻分佈、高斯分佈）的噪聲Z生成一個類似真實訓練資料的樣本，追求效果是越像真實樣本越好；

一文讀懂對抗生成網路的3種模型

https://www.toutiao.com/i6635851641293636109/ 2018-12-17 14:53:28 基於對抗生成網路技術的線上工具edges2cats，可以為簡筆畫塗色前言在GAN系

50行程式碼實現對抗生成網路GAN

轉自大牛Dev Nag。Dev Nag是前谷歌高階工程師、AI 初創公司 Wavefront 創始人兼 CTO，本文介紹了他是如何用不到五十行程式碼，在 PyTorch 平臺上完成對 GAN 的訓練。 In 2014, Ian Goodfellow and his colleagues at the U

對抗生成網路原理和作用

我們通過一個demo（gan.py ）來講解對抗生成網路的原理和作用 1、建立真實資料 2、使用GAN訓練噪聲資料 3、通過1200次的訓練使得生成的資料的分佈跟真實資料的分佈差不多 4、通過debug方式一步步的講解二、原理： 1、G（

Tensorflow(1.0)基於對抗生成網路生成明星臉

經過一天的訓練已經基本有了人樣：原文是基於python2.7切tensorflow版本較老下面在python3.5和Tensorflow1.0版本執行成功 # -*- coding:utf-8 -*- import os import random imp

通俗瞭解對抗生成網路(GAN)核心思想

GAN已經作為一種思想來滲透在ML的其餘領域，做出了很多很Amazing的東西。被Yann LeCun評價為近十年最有趣的idea，所以相關研究方向的同學gan成了一個必須要學的思想和方法。 Basic Idea of GAN (Generator) GA

【備忘】2017年深度學習專案實戰之對抗生成網路視訊課程

第1章深度學習專案實戰-對抗生成網路（GAN）1小時14分鐘9節 1-1課程簡介[免費觀看]05:21) 1-2對抗生成網路形象解釋07:17)1-3對抗生成網路工作原理09:491-4Tensorflow安裝（建議Python3.5版本下安裝）07:091-5案例實戰對

個人總結：Generative Adversarial Nets GAN原始公式的得來與推導

根據文章所述，為原始資料，使用的噪聲資料，, 為batch_size的大小。而為通過生成器生成的資料，也就是說與是能夠互相對立的競爭對手。生成器生成了妄圖模擬到的效果達到“欺騙”判別器的目的。

Generative Adversarial Nets(GAN Tensorflow)

概率制造 display 變量 pan clas cli tps OS Generative Adversarial Nets（簡稱GAN）是一種非常流行的神經網絡。它最初是由Ian Goodfellow等人在NIPS 2014論文中介紹的。這篇論文引發了很多關於神經

Wasserstein Generative Adversarial Nets(WGAN)

權重 https mathjax blank min www. margin xmlns nbsp GAN目前是機器學習中非常受歡迎的研究方向。主要包括有兩種類型的研究，一種是將GAN用於有趣的問題，另一種是試圖增加GAN的模型穩定性。事實上，穩定性在GAN訓練中是非常

Face Aging with Contextual Generative Adversarial Nets

網路結構如圖2所示,首先按照68個人臉特徵點對輸入影象進行對齊,之後,採用Deeplab v2演算法將輸入影象分割為人臉區域,和非人臉區域,並將非人臉區域標記為灰色. 生成網路-Transformer network 將處理後的影象,與年齡lable

《GraphGAN：Graph Representation Learning with Generative Adversarial Nets》論文閱讀筆記

最近在準備碩士期間的畢業論文的開題工作，也是比較愁於沒有什麼好的畢業設計的想法。在學習完這篇論文後，我發現基於生成對抗網路的網路表示學習的方法挺有意思。通過寫這篇部落格也是想要加深自己對這篇論文的idea的理解，同時也想著是否我也可以提出一種改進或是適當借鑑一下這種思想。 &nbs

Generative Adversarial Nets[Theory&MSE]

本文來自《deep multi-scale video prediction beyond mean square error》，時間線為2015年11月，LeCun等人的作品。從一個視訊序列中預測未來的影象幀涉及到構建一個內部表徵，該表徵能夠對準確對圖片幀演化（如影象內容和動態）進行建模。這就是為什麼

Resources and Implementations of Generative Adversarial Nets: GAN, DCGAN, WGAN, CGAN, InfoGAN

I organized this reposity mainly for learning GANs, so all codes about classical GANs were implemented with simple network structure and

Generative Adversarial Nets[iGAN]

本文來自《Generative Visual Manipulation on the Natural Image Manifold》，是大神Jun-Yan Zhu在2016年9月的作品。 0 引言視覺交流在現在的社會發展中一直處於技術不夠強大的現狀，比如你想要去商場買個衣服，你想要告知導購衣服的顏色

GAN（Generative Adversarial Nets）研究進展

想與大家分享的是影象生成中一些工作。這些工作都基於一大類模型，Generative Adversarial Networks（GAN）。從模型名稱上甚至都可以看出一些發展軌跡：GAN->CGAN->LAPGAN->DCGAN->GRAN-&g