輔助分類器的條件影象合成AC-GAN（Conditional Image Synthesis with Auxiliary Classifier GANs）

阿新 • • 發佈：2019-01-09

原文連結：Conditional Image Synthesis with Auxiliary Classifier GANs

文章貢獻：

1.在D的輸出部分新增一個輔助的分類器來提高條件GAN的效能

2.提出 Inception Accuracy 這種新的用於評判影象合成模型的標準

3.引進MS-SSIM用於判斷模型生成圖片的多樣性

本文工作與前人不同之處（圖片來自網際網路，當前版本論文無此圖片）：

Conditional GAN：CGAN

G：將類標籤作為條件資訊和噪聲一起放入G後生成樣本

D：將類標籤和生成樣本或者訓練樣本放入D，D的輸出是輸出樣本為真假的概率或者0，1二值

Semi-supervised GAN：

G：不輸入類別，只輸入噪聲來生成樣本

D：輸入生成樣本或者訓練樣本，最後的輸入是輸入影象所屬類別或者輸入影象為假，一共N+1維（N是總類別數）

Info-GAN：

模型將z拆分成兩個部分，一部分是沒辦法解釋的連續噪聲訊號，另一部分就是c。這裡c表示一種潛在的屬性，在人臉任務中可以解釋成面部表情、眼睛顏色、是否帶眼鏡、頭髮型別等，在minst手寫資料集上可以解釋成數字類別（1-9）也可以表示手寫筆畫的傾斜度、筆畫的粗細等。另外，作者將資訊理論的概念引入了GAN：

G：輸入定義的潛在變數c和噪聲

目標函式要使c和生成樣本儘可能相關，即互資訊最大

AC-GANs（本文提出）：

我們提出一個GAN架構的變體，將其稱之為輔助分類器GAN（或ACGAN，如圖2）。在AC-GAN 中，每個生成樣本除了噪聲z外有一個對應的類別標籤 c~Pc,。G 使用兩者來生成偽影象 X (fake)=G(c，z)。判別器給出給出影象源（真假）的概率分佈和類標籤上的概率分佈。損失函式如下：

G：與cGAN相同，同樣是輸入類標籤和噪聲

D：不再輸入類標籤，另外在輸入樣本是否為真的同時，利用另一個分類器來判斷輸入樣本的所屬類別

D訓練的目標是最大 $L_{S}+L_{C}$ ，G訓練的目標是最大 $L_{C}-L_{S}$

Inception Accuracy：

對於合成模型是比較難去評價的，所以之前有一部分是要人工測試，即人去判斷生成模型的真假。但是人工的測試結果變化比較大，所有後來OpenAI提出Inception Score，用於自動模擬人工的判斷。但是作者發現當模型已經崩潰，生成的影象完全不符合人的視覺感知的時候，Inception Score依舊有可能較高，所以提出了這種新的評價標準。依舊是將合成的影象輸入訓練好的Incpetion v3模型，但對比的是模型分類的準確率。這種方法相比Inception Score更好計算，而且能夠更好地反映每個類別的資訊。

實驗

最上面的實驗表示模型合成不同解析度影象的 Inception Accuracy，通過在人工降低生成影象的分析率Inception Accuracy也會隨之降低後，證明了模型所生成的高解析度影象不只是簡單增加了畫素，而是確實含有低解析度影象或者簡單resize低解析度影象得到的高解析度影象中不存在的資訊。

MS-SSIM是一個用於判斷影象在人的感知上相似度的評價標準，介於0-1之間，值越大表示影象之間相似度越大。作者引入這個標準來進一步評價模型生成影象的多樣性。在ImageNet的所有類中，最高的MS-SSIM是0.25，作者對AC-GAN生成的影象做測試後，84.7%類的MS-SSIM比0.25低，進一步說明了本文提出的模型能夠生成多樣性較大的影象。

此外，作者進一步分析了當前生成模型的不足，部分類生成影象比較相似，可能是因為模型沒有記憶，造成過擬合現象。

模型結構：

想說的：

本文在D的輸出部分新增一個輔助的分類器來提高條件GAN的效能，同時輸出真假和類別。針對任務，提出這種新的Inception Accuracy的評價方法，並引入了MS-SSIM來判斷模型的效果。提出的Inception Accuracy評估方法，實驗中時優於Inception Score的，但是並未在其他模型中進行對比實驗。

參考資料：《Conditional Image Synthesis with Auxiliary Classifier GANs》閱讀筆記

原文連結：Conditional Image Synthesis with Auxiliary Classifier GANs

輔助分類器的條件影象合成AC-GAN（Conditional Image Synthesis with Auxiliary Classifier GANs）

AC-GANs（本文提出）：

Inception Accuracy：

實驗

模型結構：

輔助分類器的條件影象合成AC-GAN（Conditional Image Synthesis with Auxiliary Classifier GANs）

用線性分類器實現預測鳶尾花的種類（python）

AC自動機（查找子串各出現次數）

【181118】一款VC++影象開場載入效果（漸入，馬賽克，滑入）原始碼

【GAN ZOO翻譯】StackGAN：Text to Photo-realistic Image Synthesis with Stacked GAN 使用堆疊的GAN從文字中生成照片一樣逼真的圖片

影象縮放演算法（用過了鄰近差值演算法）

關於科大訊飛語音合成的開發（先寫個本地的，簡單）

模式識別經典演算法——Kmeans影象聚類分割（以最短的matlab程式實現）

影象特徵點匹配（視訊質量診斷、畫面抖動檢測）

服務器返回中文亂碼的情況（UTF8編碼 -> 轉化為 SYSTEM_LOCALE 編碼）

OpenCV計算機視覺學習（13）——影象特徵點檢測（Harris角點檢測，sift演算法）

用PyTorch建立一個影象分類器？So easy！（Part 1）

用PyTorch建立一個影象分類器？So easy！（Part 2）

影象分類基本流程及 KNN 分類器

Tensorflow學習筆記--使用遷移學習做自己的影象分類器（Inception v3）

白話——胡說影象分類器

影象的線性分類器（感知機、SVM、Softmax）

opencv3.0訓練自己的級聯分類器（traincascade)，將已經生成的stage.xml合成最終的分類器xml

大規模影象分類器的演化-Large-Scale Evolution of Image Classifiers-讀後雜談

基於影象識別的分類器的實現

輔助分類器的條件影象合成AC-GAN（Conditional Image Synthesis with Auxiliary Classifier GANs）

AC-GANs（本文提出）：

Inception Accuracy：

實驗

模型結構：

相關推薦