【Tensorflow tf 掏糞記錄】筆記四——tensorflow搭建GAN神經網路


  • config.yam:
    • 用來設定各種類似學習率(learning_rate), Leaky Relu所使用的alpha,迭代次數(epoch)等。我們可以指定訓練的影象的標籤。比如說可以單獨訓練標籤為‘8’的資料,並生成類似‘8’的資料。方便我們調參。
  • train.py:
    • 放置訓練使用的程式碼與神經網路。這裡我是用了tensorboard,tensorboard將會把生成器(Generator)的loss與鑑別器(Discriminator)的loss分別展示到tensorboard中。我們可以在訓練的過程中實時觀察各個loss的走勢。以及我把每次生成器(Generator)生成的圖片都儲存在了硬碟中,我們也可以實時的觀察機器學習的成果。
  • utils.py:
    • 放置組成神經網路,預處理資料等train.py中需要用到的工具。例如data_batch()等。




因為tensorflow中沒有Leaky Relu函式,所以需要自己實現。所以tf.layer.dense()中的activation = None我不希望它自動呼叫了其他啟用函式。



def generator( z, out_dim, n_units = 128, reuse = False, alpha = 0.01 ):
        with tf.variable_scope( 'generator', reuse = reuse ):    #命名閉包中程式碼的變數
            h1 = tf.layers.dense( z, n_units, activation = None )    # 宣告全連線神經網路

            h1 = tf.maximum( alpha * h1, h1 )    # Leaky Relu
            logits = tf.layers.dense( h1, out_dim, activation = None )
            out = tf.tanh( logits )

         return out


分類器用的啟用函式也是Leaky Relu函式。結構跟生成器(Generator)類似,只不過最後的一層的啟用函式換成了tf.sigmoid(),而且最一層全連線層的神經元數我只設定了一個,因為我發現tf.sigmoid()啟用函式並沒有對模型有很大的幫助。


def discriminator( x, n_units = 128, reuse = False, alpha = 0.01 ):
    with tf.variable_scope( 'discriminator', reuse = reuse ):

        h1 = tf.layers.dense( x, n_units, activation = None )    

        # Leacy ReLU
        h1 = tf.maximum( alpha * h1, h1 )

        logits = tf.layers.dense( h1, 1, activation = None )
        out = tf.sigmoid( logits )

        return out, logits




這裡呼叫了兩次鑑別器(Discriminator),其中第一次是輸入真圖片,並努力不誤判為假圖片。第二次是輸入生成器(Generator)生成的假圖片,嘗試努力鑑別出為假圖片。為了保證第一次與第二次所用的生成器的效能一致,我使用了reuse = True來保證tensorflow會重新使用相同的鑑別器(Discriminator)而不是重新new一個。


input_real, input_z = utils.model_inputs( input_size, z_size )    # 建立佔位符

g_model = utils.generator( input_z, input_size, n_units = g_hidden_size, alpha = alpha )    # 建立生成器

d_model_real, d_logits_real = utils.discriminator( input_real, n_units = d_hidden_size, alpha = alpha )    # 鑑別真圖片

d_model_fake, d_logits_fake = utils.discriminator( g_model, reuse = True, n_units = d_hidden_size, alpha = alpha )    # 鑑別假圖片





d_loss_real = tf.reduce_mean( tf.nn.sigmoid_cross_entropy_with_logits( logits = d_logits_real,
                                                                       labels = tf.ones_like( d_logits_real ) * ( 1 - smooth ), name = 'd_loss_real' ) )    # 計算鑑別器鑑別真圖片的Loss

d_loss_fake = tf.reduce_mean( tf.nn.sigmoid_cross_entropy_with_logits( logits = d_logits_fake,
                                                                       labels = tf.zeros_like( d_logits_fake ), name = 'd_loss_fake' ) )    # 計算鑑別器鑑別假圖片的Loss

d_loss = d_loss_real + d_loss_fake    # 鑑別器總Loss為兩個鑑別器Loss的總和        

tf.summary.scalar('d_loss', d_loss)    # 把資料加入tensorboard

g_loss = tf.reduce_mean( tf.nn.sigmoid_cross_entropy_with_logits( logits = d_logits_fake,
                                                                  labels = tf.ones_like( d_logits_fake ), name = 'g_loss' ) )    # 計算生成器的Loss
tf.summary.scalar('g_loss', g_loss)    # 把資料加入tensorboard





batch_size = FLAGS.batch_size
epoches = FLAGS.epoches
samples = []
# losses = []
saver = tf.train.Saver( var_list = g_vars )    # 我們只儲存生成器的變數
with tf.Session() as sess:
    merged, writer = utils.print_training_loss(sess)

    sess.run( tf.global_variables_initializer() )
    for e in range( epoches ):
        for batch in batches:
            batch_images = batch
            batch_images = batch_images * 2 - 1

            batch_z = np.random.uniform( -1, 1, size = ( batch_size, z_size ) )
            _ = sess.run( d_train_opt, feed_dict = {input_real : batch_images, input_z : batch_z} )
            _ = sess.run( g_train_opt, feed_dict = {input_z : batch_z} )

        train_loss_d = sess.run( d_loss, {input_z : batch_z, input_real : batch_images} )    # 列印Loss
        train_loss_g = g_loss.eval( {input_z : batch_z} )

        print( 'Epoch {}/{}...' . format( e + 1, epoches ),
               'Discriminator Loss: {:.4f}...' . format( train_loss_d ),
               'Generator Loss: {:.4f}' . format( train_loss_g ) )   

        # 加入tensorboard
        rs = sess.run(merged, feed_dict={input_z: batch_z, input_real: batch_images})
        writer.add_summary(rs, e)

        sample_z = np.random.uniform( -1, 1, size = ( 16, z_size ) )
        gen_samples = sess.run(
            utils.generator( input_z, input_size, n_units = g_hidden_size, reuse = True, alpha = alpha),
            feed_dict = {input_z : sample_z} )

        gen_image = gen_samples.reshape( ( -1, 28, 28, 1 ) )    # 把陣列轉換成high,width,channal形式
        gen_image = tf.cast( np.multiply( gen_image, 255 ), tf.uint8 )    # 數值乘255
        for r in range( gen_image.shape[0] ):
            with open( FLAGS.generate_file + str(e) + ' ' + str( r ) + '.jpg', 'wb' ) as img:
                img.write( sess.run( tf.image.encode_jpeg( gen_image[r] ) ) )    # 儲存圖片

        samples.append( gen_samples )
        saver.save( sess, './checkpoint/generator.ckpt' )


一個4, 一個9, 一個1



