Salimans, Tim, et al. “Improved techniques for training gans.” Advances in Neural Information Processing Systems. 2016.

概述

GAN的發明者Ian Goodfellow2016年在Open AI任職期間發表了這篇論文，其中提到了GAN用於半監督學習(semi supervised)的方法。稱為SSGAN。
作者給出了Theano+Lasagne實現。本文結合原始碼對這種方法的推導和實現進行講解。1

半監督學習

考慮一個分類問題。
如果訓練集中大部分樣本沒有標記類別，只有少部分樣本有標記。則需要用半監督學習

(semi-supervised)方法來訓練一個分類器。

wiki上的這張圖很好地說明了無標記樣本在半監督學習中發揮作用：
這裡寫圖片描述

如果只考慮有標記樣本（黑白點），純粹使用監督學習。則得到垂直的分類面。
考慮了無標記樣本（灰色點）之後，我們對樣本的整體分佈有了進一步認識，能夠得到新的、更準確的分類面。

核心理念

在半監督學習中運用GAN的邏輯如下。

無標記樣本沒有類別資訊，無法訓練分類器；
引入GAN後，其中生成器(Generator)可以從隨機訊號生成偽樣本；
相比之下，原有的無標記樣本擁有了人造類別：真。可以和偽樣本一起訓練分類器。

舉個通俗的例子：就算沒人教認字，多練練分辨“是不是字”也對認字有好處。有粗糙的反饋，也比沒有反饋強。

原理

框架

GAN中的兩個核心模組是生成器(Generator)和鑑別器(Discriminator)。這裡用分類器(Classifier)代替了鑑別器。
這裡寫圖片描述

訓練集中包含有標籤樣本xl和無標籤樣本xu。
生成器從隨機噪聲生成偽樣本If。
分類器接受樣本I，對於K類分類問題，輸出K+1維估計l，再經過softmax函式得到概率p：其前K維對應原有K個類，最後一維對應“偽樣本”類。
p的最大值位置對應為估計標籤y。

softmax(xi)=exp(xi)∑jexp(xj)

三種誤差

整個系統涉及三種誤差。

對於訓練集中的有標籤樣本，考察估計的標籤是否正確。即，計算分類為相應的概率：

Llabel=−E[lnp(y|x)]

對於訓練集中的無標籤樣本，考察是否估計為“真”。即，計算不估計為K+1類的概率：

Lunlabel=−E[ln(1−p(K+1|x))]

對於生成器產生的偽樣本，考察是否估計為“偽”。即，計算估計為K+1類的概率：

Lfake=−E[lnp(K+1|x)]

推導

考慮softmax函式的一個特性：

softmax(xi−c)=exp(xi−c)∑jexp(xj−c)=exp(xi)/exp(c)∑jexp(xj)/exp(c)=softmax(xi)
即，如果輸入各維減去同一個數，softmax結果不變。
於是，可以令l→l−lK+1，有lK+1=0，p=softmax(l)保持不變。

期望號略去不寫，利用explK+1=1，後兩種代價變為：

Lunlabel=−ln[1−p(K+1|x)]=−ln⎡⎣∑Kj=1explj∑Kj=1explj+explK+1⎤⎦=−ln⎡⎣∑j=1Kexplj⎤⎦+ln⎡⎣1+∑j=1Kexplj⎤⎦ Lfake=−ln[p(K+1|x)]=ln⎡

【平價資料】GAN用於半監督學習

概述

半監督學習

核心理念

原理

框架

三種誤差

推導

【平價資料】GAN用於半監督學習

【平價資料】SimGAN：活用合成數據和無監督資料

GAN在半監督學習上的應用

手把手教你用GAN實現半監督學習

【GAN ZOO翻譯系列】Cat GAN：UNSUPERVISED AND SEMI-SUPERVISED LEARNING WITH CATEGORICAL GAN 用於監督和半監督學習的GAN

【IM】關於半監督學習的理解

【GCN】圖卷積網路的半監督學習脈絡

【半監督學習】MixMatch、UDA、ReMixMatch、FixMatch

【論文解讀】【半監督學習】【Google教你水論文】A Simple Semi-Supervised Learning Framework for Object Detection

【詳細資料】ICN6202：MIPI DSI轉LVDS芯片簡介

【完整資料】TC358779XBG：HDMI轉MIPI DSI芯片方案

【收集資料】OpenGL學習

偽標籤：教你玩轉無標籤資料的半監督學習方法

【學習資料】持續整合---測試自動化學習

【大資料】Hive作者肯定進修過藍翔挖掘機

【大資料】CentOS6.5安裝mysql5.6(靠譜！)

【大資料】瞭解Hadoop框架的基礎知識

Jmeter，使用【外部檔案資料】作為【請求資料】發起HTTP請求

【大資料】HDFS

【大資料】什麼是hadoop

【平價資料】GAN用於半監督學習

概述

半監督學習

核心理念

原理

框架

三種誤差

推導

相關推薦