tensorflow正則化新增方法整理

阿新 • • 發佈：2018-12-24

一、基礎正則化函式

tf.contrib.layers.l1_regularizer(scale, scope=None)

返回一個用來執行L1正則化的函式,函式的簽名是func(weights).
引數:

scale: 正則項的係數.
scope: 可選的scope name

tf.contrib.layers.l2_regularizer(scale, scope=None)

先看看tf.contrib.layers.l2_regularizer(weight_decay)都執行了什麼：

import tensorflow as tf

sess=tf.Session()

weight_decay=0.1

tmp=tf.constant([0,1,2,3],dtype=tf.float32)

"""

l2_reg=tf.contrib.layers.l2_regularizer(weight_decay)

a=tf.get_variable("I_am_a",regularizer=l2_reg,initializer=tmp)

"""

#**上面程式碼的等價程式碼

a=tf.get_variable(

"I_am_a",initializer=tmp)

a2=tf.reduce_sum(a*a)*weight_decay/2;

a3=tf.get_variable(a.name.split(":")[0]+"/Regularizer/l2_regularizer",initializer=a2)

tf.add_to_collection(tf.GraphKeys.REGULARIZATION_LOSSES,a2)

#**

sess.run(tf.global_variables_initializer())

keys = tf.get_collection(tf.GraphKeys.REGULARIZATION_LOSSES)

for key in keys:

print("%s : %s" %(key.name,sess.run(key)))

我們很容易可以模擬出tf.contrib.layers.l2_regularizer都做了什麼，不過會讓程式碼變醜。

以下比較完整實現L2 正則化。

import tensorflow as tf

sess=tf.Session()

weight_decay=0.1 #(1)定義weight_decay

l2_reg=tf.contrib.layers.l2_regularizer(weight_decay) #(2)定義l2_regularizer()

tmp=tf.constant([0,1,2,3],dtype=tf.float32)

a=tf.get_variable("I_am_a",regularizer=l2_reg,initializer=tmp) #(3)建立variable，l2_regularizer複製給regularizer引數。

#目測REXXX_LOSSES集合

#regularizer定義會將a加入REGULARIZATION_LOSSES集合

print("Global Set:")

keys = tf.get_collection("variables")

for key in keys:

print(key.name)

print("Regular Set:")

keys = tf.get_collection(tf.GraphKeys.REGULARIZATION_LOSSES)

for key in keys:

print(key.name)

print("--------------------")

sess.run(tf.global_variables_initializer())

print(sess.run(a))

reg_set=tf.get_collection(tf.GraphKeys.REGULARIZATION_LOSSES) #(4)則REGULARIAZTION_LOSSES集合會包含所有被weight_decay後的引數和，將其相加

l2_loss=tf.add_n(reg_set)

print("loss=%s" %(sess.run(l2_loss)))

"""

此處輸出0.7,即:

weight_decay*sigmal(w*2)/2=0.1*(0*0+1*1+2*2+3*3)/2=0.7

其實程式碼自己寫也很方便，用API看著比較正規。

在網路模型中，直接將l2_loss加入loss就好了。(loss變大，執行train自然會decay)

"""

回到頂部

二、新增正則化方法

a、原始辦法

正則化常用到集合，下面是最原始的新增正則辦法（直接在變數聲明後將之新增進'losses'集合或tf.GraphKeys.LOESSES也行）：

import tensorflow as tf

import numpy as np

def get_weights(shape, lambd):

var = tf.Variable(tf.random_normal(shape), dtype=tf.float32)

tf.add_to_collection('losses', tf.contrib.layers.l2_regularizer(lambd)(var))

return var

x = tf.placeholder(tf.float32, shape=(None, 2))

y_ = tf.placeholder(tf.float32, shape=(None, 1))

batch_size = 8

layer_dimension = [2, 10, 10, 10, 1]

n_layers = len(layer_dimension)

cur_lay = x

in_dimension = layer_dimension[0]

for i in range(1, n_layers):

out_dimension = layer_dimension[i]

weights = get_weights([in_dimension, out_dimension], 0.001)

bias = tf.Variable(tf.constant(0.1, shape=[out_dimension]))

cur_lay = tf.nn.relu(tf.matmul(cur_lay, weights)+bias)

in_dimension = layer_dimension[i]

mess_loss = tf.reduce_mean(tf.square(y_-cur_lay))

tf.add_to_collection('losses', mess_loss)

loss = tf.add_n(tf.get_collection('losses'))

b、tf.contrib.layers.apply_regularization(regularizer, weights_list=None)

先看引數

regularizer:就是我們上一步建立的正則化方法
weights_list: 想要執行正則化方法的引數列表,如果為None的話,就取GraphKeys.WEIGHTS中的weights.

函式返回一個標量Tensor,同時,這個標量Tensor也會儲存到GraphKeys.REGULARIZATION_LOSSES中.這個Tensor儲存了計算正則項損失的方法.

tensorflow中的Tensor是儲存了計算這個值的路徑(方法),當我們run的時候,tensorflow後端就通過路徑計算出Tensor對應的值

現在,我們只需將這個正則項損失加到我們的損失函式上就可以了.

如果是自己手動定義weight的話,需要手動將weight儲存到GraphKeys.WEIGHTS中,但是如果使用layer的話,就不用這麼麻煩了,別人已經幫你考慮好了.(最好自己驗證一下tf.GraphKeys.WEIGHTS中是否包含了所有的weights,防止被坑)

c、使用slim

使用slim會簡單很多：

with slim.arg_scope([slim.conv2d, slim.fully_connected],

activation_fn=tf.nn.relu,

weights_regularizer=slim.l2_regularizer(weight_decay)）：

pass

此時新增集合為tf.GraphKeys.REGULARIZATION_LOSSES。

tensorflow正則化新增方法整理

一、基礎正則化函式 tf.contrib.layers.l1_regularizer(scale, scope=None) 返回一個用來執行L1正則化的函式,函式的簽名是func(weights). 引數: scale: 正則項的係數. scope: 可選的

tensorflow-正則化與指數衰減率

指數衰減率先用較大的學習率快速迭代，得到一個較優的解。然後，指數衰減法生效，隨著迭代的繼續逐步減少學習率，這樣，可以得到更穩定的解。decayed_learning_rate=learning_rate*decay_rate^(global_step/decay_steps)decay_rate衰減係數dec

Tensorflow正則化函式tf.contrib.layers.l1_regularizer()和tf.contrib.layers.l2_regularizer()

L1正則化公式： L2正則化公式： tf.contrib.layers.l1_regularizer()和tf.contrib.layers.l2_regularizer()是Tensoflow中L1正則化函式和L2正則化函式的API。其基本用法如下： import

tensorflow-正則化+指數衰減+滑動平均

truncate 設置 put __name__ pri 計算 pytho ida env #!/usr/bin/env python2 # -*- coding: utf-8 -*- """ Created on Tue Sep 19 09:42:22 2017 @au

Tensorflow實現Xaiver初始化、權重寫入L2正則、新增LRN層

源自Tensorflow實戰的黃文堅、唐源書中的啟發： def xavier_init(fan_in, fan_out, constant = 1): low = -constant * np.sqrt(6.0 / (fan_in + fan_out))

TensorFlow——dropout和正則化的相關方法

1.dropout dropout是一種常用的手段，用來防止過擬合的，dropout的意思是在訓練過程中每次都隨機選擇一部分節點不要去學習，減少神經元的數量來降低模型的複雜度，同時增加模型的泛化能力。雖然會使得學習速度降低，因而需要合理的設定保留的節點數量。在TensorFlow中dropout的函式原

[轉] [機器學習] 常用數據標準化（正則化）的方法

機器學習數據評價分享函數 http mean 常用方法訓練數據正則化目的：為了加快訓練網絡的收斂性，可以不進行歸一化處理源地址：http://blog.sina.com.cn/s/blog_8808cae20102vg53.html 而在多指標評價體系中，

TensorFlow 過擬合與正則化(regularizer)

sdn 就是 one 方式 regular logs none 使用 log 所謂過擬合，就是當一個模型過於復雜後，它可以很好的處理訓練數據的每一個數據，甚至包括其中的隨機噪點。而沒有總結訓練數據中趨勢。使得在應對未知數據時錯誤裏一下變得很大。這明顯不是我們要的結果。我們

正則化的其他方法

擬合重新 span font 放大方法除了出現梯度下降　　除了L2正則化和dropout（隨機失活）正則化之外，還有幾種方法可以減少神經網絡的過擬合，即數據集擴增和 early stopping。一、數據擴增　　在計算機視覺數據中，通常做法是對圖片的水平翻

正則化方法 L1和L2 regularization 資料集擴增 dropout

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

損失函式正則化方法

正則化方法為防止模型過擬合，提高模型的泛化能力，通常會在損失函式的後面新增一個正則化項。L1正則化和L2正則化可以看做是損失函式的懲罰項。所謂【懲罰】是指對損失函式中的某些引數做一些限制 L1正則化(ℓ1 -norm) 使用L1正則化的模型建叫做Lasso Regulariza

【機器學習】正則化方法

正則化方法：L1和L2 regularization、資料集擴增、dropout 正則化方法：防止過擬合，提高泛化能力，減少部分特徵的權重，進而忽略部分無關緊要的特徵。因為考慮全部特徵會將噪聲加入進去，也就導致過擬合。在訓練資料不夠多時，或者overtraining時，常常會導致overf

神經網路正則化方法

正則化方法：防止過擬合，提高泛化能力在訓練資料不夠多時，或者overtraining時，常常會導致overfitting（過擬合）。其直觀的表現如下圖所示，隨著訓練過程的進行，模型複雜度增加，在training data上的error漸漸減小，但是在驗證集上的error卻

機器學習 - 正則化方法：L1和L2 regularization、資料集擴增、dropout

正則化方法：防止過擬合，提高泛化能力常用的正則化方法有：L1正則化；L2正則化；資料集擴增；Droupout方法 (1) L1正則化 (2) L2正則化 (3) Droupout 【參考】https://blog.cs

TensorFlow北大公開課學習筆記4.4-神經網路優化----正則化（正則化損失函式）

今天學習了正則化，主要內容是：通過程式碼比較正則化與不正則化的區別。什麼叫過擬合？神經網路模型在訓練資料集上的準確率較高，在新的資料進行預測或分類時準確率較低，說明模型的泛化能力差什麼叫正則化：？在損失函式中給每個引數

吳恩達深度學習筆記(34)-你不知道的其他正則化方法

其他正則化方法（Other regularization methods）除了L2正則化和隨機失活（dropout）正則化，還有幾種方法可以減少神經網路中的過擬合: 一.資料擴增假設你正在擬合貓咪圖片分類器，如果你想通過擴增訓練資料來解決過擬合，但擴增資料代價高，而且有

AI-033: Google機器學習教程（ML Crash Course with TensorFlow APIs）筆記10 - 正則化

本文是Google機器學習教程（ML Crash Course with TensorFlow APIs）的學習筆記。教程地址： https://developers.google.com/machine-learning/crash-course/ml-intro 10 正則化防止過

正則化方法：L1和L2 regularization、資料集擴增、dropout

正則化方法：防止過擬合，提高泛化能力在訓練資料不夠多時，或者overtraining時，經常會導致overfitting（過擬合）。其直觀的表現例如以下圖所看到的。隨著訓練過程的進行，模型複雜度新增，在training data上的error漸漸減小。可是在驗證集上的error卻反而漸漸增

[一種通用的正則化方法Dropout] 深入理解Dropout正則化思想和實現方法

論文題目： Dropout: A Simple Way to Prevent Neural Networks from Overfitting （1）過擬合問題：具有大量引數的深度神經網路是非常強大的機器學習系統。然而，在這樣的網路中，過度擬合是一個嚴重的問題。包含多個非線性隱含

正則化方法小結

來自：https://mp.weixin.qq.com/s/CDMBQPgzcrjbZ_sX01q2hQ 在演算法中使用正則化的目的是防止模型出現過擬合。提到正則化，想到L1範數和L2範數。在這之前，先看LP範數是什麼。 LP範數範數簡單理解為向量空間中的距離，距離

tensorflow正則化新增方法整理

一、基礎正則化函式

tf.contrib.layers.l1_regularizer(scale, scope=None)

tf.contrib.layers.l2_regularizer(scale, scope=None)

二、新增正則化方法

a、原始辦法

b、tf.contrib.layers.apply_regularization(regularizer, weights_list=None)

c、使用slim

相關推薦