【神經網路】GAN原理總結，CatGAN

阿新 • • 發佈：2019-02-16

定義及原理：

生成器（G）generator：接收一個隨機的噪聲z（隨機數），通過這個噪聲生成影象。G的目標就是儘量生成真實的圖片去欺騙判別網路D。

判別器（D） discriminator：對接收的圖片進行真假判別。它的輸入引數是x，x代表一張圖片，輸出D（x）代表x為真實圖片的概率，如果為1，就代表100%是真實的圖片，而輸出為0，就代表不可能是真實的圖片。D的目標就是儘量辨別出G生成的假影象和真實的影象。

GAN的主要靈感來源於博弈論中零和博弈的思想，應用到深度學習神經網路上來說，就是通過G和D不斷博弈，進而使G學習到資料的分佈，如果用到圖片生成上，則訓練完成後，G可以從一段隨機數中生成逼真的影象。

訓練過程中，G和D構成了一個動態的“博弈過程”，最終的平衡點即納什均衡點：生成器生成的影象接近於真實影象分佈，而判別器識別不出真假影象，對於給定影象的預測為真的概率基本接近 0.5（相當於隨機猜測類別）

過程

第一代的Generator，然後他產生一些圖片
訓練產生第一代discriminator，能夠區分人工產生的和真實的圖片
訓練第二代Generator，使其產生的圖片騙過第一代discriminator
以此類推。。。

優點

只用到了反向傳播
相比其他所有模型, GAN可以產生更加清晰，真實的樣本
GAN應用到一些場景上，比如圖片風格遷移，超解析度，影象補全，去噪，避免了損失函式設計的困難，不管三七二十一，只要有一個的基準，直接上判別器，剩下的就交給對抗訓練了

缺點

訓練GAN需要達到納什均衡,有時候可以用梯度下降法做到,有時候做不到.我們還沒有找到很好的達到納什均衡的方法,所以訓練GAN相比VAE或者PixelRNN是不穩定的,但我認為在實踐中它還是比訓練玻爾茲曼機穩定的多
GAN不適合處理離散形式的資料，比如文字
GAN存在訓練不穩定、梯度消失、模式崩潰的問題（目前已解決）

應用

圖片生成
替換判別器為一個分類器，做多分類任務，而生成器仍然做生成任務，輔助分類器訓練
和強化學習結合，目前一個比較好的例子就是seq-GAN

CatGAN

無監督的分類會被轉化為一個聚類問題，通常是以某種距離作為度量準則，從而將資料劃分為多個類別，而本文則是採用資料的熵來作為衡量標準構建來CatGAN (ICLR-2016) 。具體來說，對於真實的資料

，模型希望判別器不僅能具有較大的確信度將其劃分為真實樣本，同時還有較大的確信度將資料劃分到某一個現有的類別中去；而對於生成資料卻不是十分確定要將其劃分到哪一個現有的類別，也就是這個不確信度比較大，從而生成器的目標即為產生出那些“將其劃分到某一類別中去”的確信度較高的樣本，嘗試騙過判別器。接下來，為了衡量這個確信程度，作者用熵來表示，熵值越大，即為越不確定；而熵值越小，則表示越確定。然後，將該確信度目標與原始GAN的真偽鑑別的優化目標結合，即得到了CatGAN的最終優化目標。

對於半監督的情況，對有標籤資料計算交叉熵損失，而對無標籤資料計算上面的基於熵的損失，然後在原來的目標函式的基礎上進行疊加即得，當用該半監督方法進行目標識別與分類時，其效果雖然相對較優，但相對當下state-of-the-art的方法並沒有比較明顯的提升。但其基於熵損失的無監督訓練方法卻表現較好，其實驗效果如下圖所示，可以看到，對於如下的典型環形資料，CatGAN可以較好地找到兩者的分類面，實現無監督聚類的功能。

GAN of Salimans et al. (2016)

GAN網路使用梯度下降的方法只會找到低的損失，不能找到真正的納什均衡。本論文中，作者通過引入了一些方法，提高網路的收斂。

原始的GAN網路的目標函式需要最大化判別網路的輸出。作者提出了新的目標函式，motivation就是讓生成網路產生的圖片，經過判別網路後的中間層的feature 和真實圖片經過判別網路的feature儘可能相同。

相比原先的方式，生成網路G產生的資料更符合資料的真實分佈。作者雖然不保證能夠收斂到納什均衡點，但是在傳統GAN不能穩定收斂的情況下，新的目標函式仍然有效。

判別網路從輸入到輸出逐層卷積，pooling，圖片資訊逐漸損失，因此中間層能夠比輸出層得到更好的原始圖片的分佈資訊，拿中間層的feature作為目標函式比輸出層的結果，能夠生成圖片資訊更多，生成的圖片會效果會更好。

Semi-supervised learning

對於GAN網路，可以把生成網路的輸出作為第K+1類，相應的判別網路變為K+1類的分類問題。用Pmodel(y=K+1|x)Pmodel(y=K+1|x)表示生成網路的圖片為假

【神經網路】GAN原理總結，CatGAN

定義及原理：生成器（G）generator：接收一個隨機的噪聲z（隨機數），通過這個噪聲生成影象。G的目標就是儘量生成真實的圖片去欺騙判別網路D。判別器（D） discriminator：對接收的圖片進行真假判別。它的輸入引數是x

【神經網路】自編碼聚類演算法--DEC (Deep Embedded Clustering)

1.演算法描述最近在做AutoEncoder的一些探索，看到2016年的一篇論文，雖然不是最新的，但是思路和方法值得學習。論文原文連結 http://proceedings.mlr.press/v48/xieb16.pdf，論文有感於t-SNE演算法的t-

【神經網路】VGG、ResNet、GoogleLeNet、AlexNet等常用網路程式碼及預訓練模型

常用資料集：模型們在ImageNet競賽上的top-5錯誤率概況：常用預訓練模型池： AlexNet資訊如上圖 - 在當時第一次使用了ReLU - 使用了Norm層（在當時還不廣泛） - 訓練資料量增大 - dropout 0.5 - 每批資料

【神經網路】神經網路視覺化工具

t-SNE 方法：在fc7（倒數第一層fc）提取輸出，並用歐氏距離遠近展示（或聚類）。好的網路可以直觀看到同分類的圖片聚在一起，幾何上易被切割出來。一個例子： Visualizing Activations 方法： 1. 逆向使用已訓練好的神經網路生成圖

【神經網路】神經元ReLU、Leaky ReLU、PReLU和RReLU的比較

下圖是ReLU、Leaky ReLU、PReLU和RReLU的比較： ReLU，對小於0部分，直接置為0； Leaky ReLU，對小於0部分，進行這樣的轉換：y_i=a_i

【神經網路】卷積層輸出大小計算（長、寬、深度）

先定義幾個引數輸入圖片大小 W×W Filter大小 F×F 步長 S padding的畫素數 P 於是我們可以得出 N = (W − F + 2P )/S+1 輸出圖片大小為 N×N 轉載：卷積中的特徵圖大小計算方式有兩種，分別是‘VALID’和‘SAM

【神經網路】RELU 啟用函式及其他相關的函式

轉載自：http://blog.csdn.net/u013146742/article/details/51986575 日常 coding 中，我們會很自然的使用一些啟用函式，比如：sigmoid、ReLU等等。不過好像忘了問自己一(n)件事：為什

【神經網路】神經網路架構大全剖析（附原始論文地址）

隨著新的神經網路架構不時出現，很難跟蹤這些架構。知道所有縮寫（DCIGN，BiLSTM，DCGAN，anyone?）起初可能有點壓倒性。所以我決定編寫一個包含許多這些體系結構的備忘單。這些大多數是神經網路，有些是完全不同的野獸。雖然所有這些體系結構都是新穎而獨特的，但是當

【神經網路】神經網路加速之量化模型

1.簡介量化模型（Quantized Model）是一種模型加速（Model Acceleration）的方法的總稱，主要包括二值化網路（Binary Network）、三值化網路（Ternary Network）、深度壓縮（Deep Compre

【深度學習】GAN生成對抗網路原理詳解（1）

一個 GAN 框架，最少（但不限於）擁有兩個組成部分，一個是生成模型 G，一個是判別模型 D。在訓練過程中，會把生成模型生成的樣本和真實樣本隨機地傳送一張（或者一個 batch）給判別模型 D。判別模型 D 的目標是儘可能正確地識別出真實樣本（輸出為“真”，或者1），和儘可能

【Deep learning】卷積神經網路CNN演算法原理

寫在前面在上一篇【Deep learning】卷積神經網路CNN結構中我們簡單地介紹了CNN的結構。接下來我們看看這種結構的CNN模型是怎麼執行的，包括CNN的前向傳播和反向傳播演算法。1.CNN前向傳播演算法（1）輸入層前向傳播到卷積層輸入層的前向傳播是CNN前向傳播演算法

【深度學習技術】卷積神經網路常用啟用函式總結

本文記錄了神經網路中啟用函式的學習過程，歡迎學習交流。神經網路中如果不加入啟用函式，其一定程度可以看成線性表達，最後的表達能力不好，如果加入一些非線性的啟用函式，整個網路中就引入了非線性部分，增加了網路的表達能力。目前比較流行的啟用函式主要分為以下7種：

【計算機網路】資料鏈路層總結

資料鏈路層目錄資料鏈路層概述基本概念資料鏈路層的三個基本問題點對點通道的資料鏈路層概述 PPP協議的組成 PPP幀的格式和要求 PPP協議的工作狀態廣播通道的資料鏈路層區域網和乙太

【神經網路入門】用JAVA實現感知器演算法

簡述隨著網際網路的高速發展，A（AI）B（BigData）C（Cloud）已經成為當下的核心發展方向，假如三者深度結合的話，AI是其中最核心的部分。所以如果說在未來社會，每個人都必須要學會程式設計的話，那麼對於程式設計師來說，人工智慧則是他們所必須掌握的技術（科技發展真tm快）。這篇文章介紹

【轉載】【計算機網路】【TCP】當我們說"TCP是可靠協議"時，我們真正表達的是什麼？

很明確地說，從通訊意義上推敲，TCP一點都不可靠。一個抽象的協議，怎麼可能左右介質來保證可靠，不存在的。但凡是經由某種介質的通訊行為均不可能是絕對可靠的！正好比我們現實生活中的保險，其實它什麼都不能阻止，什麼風險也保證不了它的不發生，它保證不了飛機不會掉下來

【計算機網路】（一）OSI, TCP/IP模型 & 網路HTTP、TCP、UDP、Socket 基本知識總結

OSI 七層模型　　我們一般使用的網路資料傳輸由下而上共有七層,分別為物理層、資料鏈路層、網路層、傳輸層、會話層、表示層、應用層,也被依次稱為 OSI 第一層、第二層、⋯⋯、第七層。如下圖: 各層功能簡介 1.物理層(Physical Layer) 　

【小菜鳥】本人部落格，沒有任何侵權的想法，僅僅是總結了一些前輩們的經驗，做了一些小筆記發表。在以往學習過程中，遇到太多太多的小問題，網上都有答案，只不過太多太雜，解決問題的答案也是可遇不可求，總是事倍功半。特此總結出一些自己的小經驗，希望能夠幫助大家。

小菜鳥本人部落格，沒有任何侵權的想法，僅僅是總結了一些前輩們的經驗，做了一些小筆記發表。在以往學習過程中，遇到太多太多的小問題，網上都有答案，只不過太多太雜，解決問題的答案也是可遇不可求，總是事倍功半。特...

【神經網路】GAN原理總結，CatGAN

定義及原理：

過程

優點

缺點

應用

CatGAN

GAN of Salimans et al. (2016)

Semi-supervised learning

【神經網路】GAN原理總結，CatGAN

【神經網路】自編碼聚類演算法--DEC (Deep Embedded Clustering)

【神經網路】VGG、ResNet、GoogleLeNet、AlexNet等常用網路程式碼及預訓練模型

【神經網路】神經網路視覺化工具

【神經網路】神經元ReLU、Leaky ReLU、PReLU和RReLU的比較

【神經網路】卷積層輸出大小計算（長、寬、深度）

【神經網路】RELU 啟用函式及其他相關的函式

【神經網路】神經網路架構大全剖析（附原始論文地址）

【神經網路】神經網路加速之量化模型

【深度學習】GAN生成對抗網路原理詳解（1）

【Deep learning】卷積神經網路CNN演算法原理

【深度學習技術】卷積神經網路常用啟用函式總結

【計算機網路】資料鏈路層總結

【神經網路入門】用JAVA實現感知器演算法

【轉載】【計算機網路】【TCP】當我們說"TCP是可靠協議"時，我們真正表達的是什麼？

【計算機網路】（一）OSI, TCP/IP模型 & 網路HTTP、TCP、UDP、Socket 基本知識總結

【資料結構】HashTable原理及實現學習總結

【神經網路和深度學習】筆記

【資料結構】LinkedList原理及實現學習總結

【神經網路】GAN原理總結，CatGAN

定義及原理：

過程

優點

缺點

應用

CatGAN

GAN of Salimans et al. (2016)

Semi-supervised learning

相關推薦