tensorflow-正則化+指數衰減+滑動平均

阿新 • • 發佈：2018-12-15

truncate 設置 put __name__ pri 計算 pytho ida env

#!/usr/bin/env python2
# -*- coding: utf-8 -*-
"""
Created on Tue Sep 19 09:42:22 2017

@author: myhaspl
"""
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data

INPUT_NODE=784
OUTPUT_NODE=10

LAYER1_NODE=500
BATCH_SIZE=100

LEARNING_RATE_BASE=0.8
LEARNING_RATE_DECAY=0.99

REGULARIZATION_RATE=0.0001
TRANING_STEPS=30000
MOVING_AVERAGE_DECAY=0.99

def inference(input_tensor,avg_class,weights1, biases1,weights2,biases2):
    if avg_class==None:#非滑動平均
        layer1=tf.nn.relu(tf.matmul(input_tensor,weights1)+biases1)
        return tf.matmul(layer1,weights2)+biases2
    else:#滑動平均
        layer1=tf.nn.relu(tf.matmul(input_tensor,avg_class.average(weights1))+avg_class.average(biases1))
        return tf.matmul(layer1,avg_class.average(weights2))+avg_class.average(biases2)

def train(mnist):
    #樣本數據與樣本標簽
    x_=tf.placeholder(tf.float32,[None,INPUT_NODE],name=‘x_-input‘)
    y_=tf.placeholder(tf.float32,[None,OUTPUT_NODE],name=‘y_-input‘)
    #參數初始值
    weights1=tf.Variable(tf.truncated_normal([INPUT_NODE,LAYER1_NODE],stddev=0.1))
    biases1=tf.Variable(tf.constant(0.1,shape=[LAYER1_NODE]))
    weights2=tf.Variable(tf.truncated_normal([LAYER1_NODE,OUTPUT_NODE],stddev=0.1))
    biases2=tf.Variable(tf.constant(0.1,shape=[OUTPUT_NODE]))
    global_step=tf.Variable(0,trainable=False)

    #非滑動平均    
    y_nohd=inference(x_,None,weights1,biases1,weights2,biases2)

    #滑動平均
    variable_averages=tf.train.ExponentialMovingAverage(MOVING_AVERAGE_DECAY,global_step)
    #滑動平均更新變量的操作
    variable_averages_op=variable_averages.apply(tf.trainable_variables())
    y_hd=inference(x_,variable_averages,weights1,biases1,weights2,biases2)

    #交叉嫡損失函數,使用softmax歸一化
    cross_entropy=tf.nn.sparse_softmax_cross_entropy_with_logits(logits=y_nohd,labels=tf.arg_max(y_,1))
    cross_entropy_mean=tf.reduce_mean(cross_entropy)
    #加入L2正則化損失
    regularizer=tf.contrib.layers.l2_regularizer(REGULARIZATION_RATE)
    regularization=regularizer(weights1)+regularizer(weights2)
    loss=cross_entropy_mean+regularization

    #設置指數衰減的學習率
    learning_rate=tf.train.exponential_decay(
            LEARNING_RATE_BASE,
            global_step,
            mnist.train.num_examples/BATCH_SIZE,
            LEARNING_RATE_DECAY)

    train_step=tf.train.GradientDescentOptimizer(learning_rate).minimize(loss,global_step=global_step)
    #訓練與更新參數的滑動平均值
    #將2大步操作打包在train_op中，第1大步操作是使用正則化和指數衰減更新參數值
    #第2大步操作是使用滑動平均再次更新參數值。
    #每次訓練都完成這2大步操作。
    train_op=tf.group(train_step,variable_averages_op)
    #檢驗滑動平均平均模型的神經網絡前向傳播結果是否正確
    correct_predection=tf.equal(tf.argmax(y_hd,1),tf.argmax(y_,1))
    accuracy=tf.reduce_mean(tf.cast(correct_predection,tf.float32))

    #開始訓練過程
    with tf.Session() as sess:
        tf.initialize_all_variables().run()
        #訓練樣本集
        validate_feed={x_:mnist.validation.images,
                       y_:mnist.validation.labels
                      }
        #測試集
        test_feed={x_:mnist.test.images,
                   y_:mnist.test.labels
                   }
        for i  in range(TRANING_STEPS):
            if i%1000==0:
                #每1000輪計算當前訓練的結果
                validate_acc=sess.run(accuracy,feed_dict=validate_feed)
                print("%d次後=>正確率%g"%(i,validate_acc))
            #每一輪使用的樣本，然後開始訓練
            xs,ys=mnist.train.next_batch(BATCH_SIZE)
            sess.run(train_op,feed_dict={x_:xs,y_:ys})

        #TRANING_STEPS次訓練結束，對測試數據進行檢測，檢驗神經網絡準確度
        test_acc=sess.run(accuracy,feed_dict=test_feed)
        print("正確率:%g"%test_acc)

def main(argv=None):
    mnist=input_data.read_data_sets("/tmp/data",one_hot=True)
    train(mnist)

if __name__==‘__main__‘:
    tf.app.run()

使用了非線性激活函數relu，防止梯度消失。

truncate 設置 put __name__ pri 計算 pytho ida env #!/usr/bin/env python2 # -*- coding: utf-8 -*- """ Created on Tue Sep 19 09:42:22 2017 @au

tensorflow-正則化與指數衰減率

指數衰減率先用較大的學習率快速迭代，得到一個較優的解。然後，指數衰減法生效，隨著迭代的繼續逐步減少學習率，這樣，可以得到更穩定的解。decayed_learning_rate=learning_rate*decay_rate^(global_step/decay_steps)decay_rate衰減係數dec

Tensorflow正則化函式tf.contrib.layers.l1_regularizer()和tf.contrib.layers.l2_regularizer()

L1正則化公式： L2正則化公式： tf.contrib.layers.l1_regularizer()和tf.contrib.layers.l2_regularizer()是Tensoflow中L1正則化函式和L2正則化函式的API。其基本用法如下： import

tensorflow正則化新增方法整理

一、基礎正則化函式 tf.contrib.layers.l1_regularizer(scale, scope=None) 返回一個用來執行L1正則化的函式,函式的簽名是func(weights). 引數: scale: 正則項的係數. scope: 可選的

使用L2正則化和平均滑動模型的LeNet-5MNIST手寫數字識別模型

put 輸出矩陣 conv2 cross -m collect variable global 空間使用L2正則化和平均滑動模型的LeNet-5MNIST手寫數字識別模型覺得有用的話,歡迎一起討論相互學習~Follow Me 參考文獻Tensorflow實戰Googl

神經網路優化演算法二（正則化、滑動平均模型）

1、神經網路進一步優化——過擬合與正則化過擬合，指的是當一個模型過為複雜後，它可以很好的“記憶”每一個訓練資料中隨機噪音的部分而忘了要去“學習”訓練資料中通用的趨勢。舉一個極端的例子，如果一個模型中的引數比訓練資料的總數還多，那麼只要訓練資料不衝突，這個模型完全可以記住所有訓練資料

TensorFlow 過擬合與正則化(regularizer)

sdn 就是 one 方式 regular logs none 使用 log 所謂過擬合，就是當一個模型過於復雜後，它可以很好的處理訓練數據的每一個數據，甚至包括其中的隨機噪點。而沒有總結訓練數據中趨勢。使得在應對未知數據時錯誤裏一下變得很大。這明顯不是我們要的結果。我們

TensorFlow北大公開課學習筆記4.4-神經網路優化----正則化（正則化損失函式）

今天學習了正則化，主要內容是：通過程式碼比較正則化與不正則化的區別。什麼叫過擬合？神經網路模型在訓練資料集上的準確率較高，在新的資料進行預測或分類時準確率較低，說明模型的泛化能力差什麼叫正則化：？在損失函式中給每個引數

AI-033: Google機器學習教程（ML Crash Course with TensorFlow APIs）筆記10 - 正則化

本文是Google機器學習教程（ML Crash Course with TensorFlow APIs）的學習筆記。教程地址： https://developers.google.com/machine-learning/crash-course/ml-intro 10 正則化防止過

TensorFlow 中的正則化（Batch Normalization）詳解和實現程式碼

雖然在訓練初期使用 He 初始化方法初始ELU（或者其他派生的ReLU）能夠有效的防止梯度彌散、爆炸問題。但是這種方式無法保證梯度問題不會在訓練過程中產生。 2015年的一篇paper（ “Batch Normalization: Accel

（windows10版）Tensorflow 實戰Google深度學習框架學習筆記（五）正則化

# 1. 生成模擬資料集import tensorflow as tfimport matplotlib.pyplot as pltimport numpy as npdata = []label = []np.random.seed(0) #每次生成相同的隨機數# 以原點為

【TensorFlow】正則化（過擬合問題）

轉載自：https://www.cnblogs.com/linyuanzhou/p/6923607.html，尊重原創 tf.add_to_collection：把變數放入一個集合，把很多變數變成一個列表 tf.get_collection：從一個結合中取出全部變數，是一個列表 tf.add_n：把一個列表

tensorflow 實現神經網路帶正則化

import matplotlib.pyplot as plt import numpy as np import tensorflow as tf from sklearn import datasets from tensorflow.python.framework

Tensorflow第六課--基於L2正則化損失函式的5層神經網路

這幾天一直在看Tensorflow：實戰google深度學習框架。感覺這本書真的寫的很好，尤其是對於Tensorflow之前毫無所知的我，通過這本書也能學懂並且瞭解很多。今天我主要是學習了損失函式。新增損失函式的主要目的是解決在訓練過程中的過擬合問題。正則化的思想就是在損失函

[Tensorflow]L2正則化和collection【tf.GraphKeys】

L2-Regularization 實現的話，需要把所有的引數放在一個集合內，最後計算loss時，再減去加權值。相比自己亂搞，程式碼一團糟，Tensorflow 提供了更優美的實現方法。一、tf.GraphKeys ：多個包含Variables(Tensor)集合

79、tensorflow計算一個五層神經網路的正則化損失係數、防止網路過擬合、正則化的思想就是在損失函式中加入刻畫模型複雜程度的指標

''' Created on Apr 20, 2017 @author: P0079482 ''' import tensorflow as tf #獲取一層神經網路邊上的權重，並將這個權重的L2正

tensorflow使用L2 regularization正則化修正overfitting過擬合

L2正則化原理：在Loss中加入引數w的平方和，這樣訓練過程中就會抑制w的值，w的值小，曲線就比較平滑，從而減小過擬合，參考公式如下圖：正則化是不影響你去擬合曲線的，並不是所有引數都會被無腦抑制，實際上這是一個動態過程，是cross_entropy和L2 loss

tensorflow06 《TensorFlow實戰Google深度學習框架》筆記-04-04正則化

# 《TensorFlow實戰Google深度學習框架》04 深層神經網路 # win10 Tensorflow1.0.1 python3.5.3 # CUDA v8.0 cudnn-8.0-windows10-x64-v5.1 # filename:ts04.

【tensorflow 學習】給LSTM加上L2正則化

首先，用tf.trainable_variables()得到所有weights和bias，然後，用tf.nn.l2_loss()計算L2 norm，求和之後作為正則項加給原來的cost function tv = tf.trainable_vari

L2正則化—tensorflow實現

L2正則化是一種減少過擬合的方法，在損失函式中加入刻畫模型複雜程度的指標。假設損失函式是J(θ)，則優化的是J(θ)+λR(w)，R(w)=∑ni=0|w2i|。在tensorflow中的具體實現過

tensorflow-正則化+指數衰減+滑動平均

相關推薦