[Tensorflow]L2正則化和collection【tf.GraphKeys】

阿新 • • 發佈：2019-01-22

L2-Regularization 實現的話，需要把所有的引數放在一個集合內，最後計算loss時，再減去加權值。

相比自己亂搞，程式碼一團糟，Tensorflow 提供了更優美的實現方法。

一、tf.GraphKeys ：多個包含Variables(Tensor)集合

（1）GLOBAL_VARIABLES：使用tf.get_variable()時，預設會將vairable放入這個集合。

我們熟悉的tf.global_variables_initializer()就是初始化這個集合內的Variables。

import tensorflow as tf
sess=tf.Session()
a=tf.get_variable("a",[3,3,32,64],initializer=tf.random_normal_initializer())
b=tf.get_variable("b",[64],initializer=tf.random_normal_initializer())
#collections=None等價於 collection=[tf.GraphKeys.GLOBAL_VARIABLES]

gv= tf.get_collection(tf.GraphKeys.GLOBAL_VARIABLES)          #tf.get_collection(collection_name)返回某個collection的列表
for var in gv: 
  print(var is a)
  print(var.get_shape())

Tips: tf.GraphKeys.GLOBAL_VARIABLES == "variable"。即其儲存的是一個字串。

（2）自定義集合

想個集合的名字，然後在tf.get_variable時，把集合名字傳給 collection 就好了。

import tensorflow as tf
sess=tf.Session()
a=tf.get_variable("a",shape=[10],collections=["mycollection"])  #不把GLOBAL_VARIABLES加進去，那麼就不在那個集合裡了。
keys=tf.get_collection("mycollection")
for key in keys:
  print(key.name)

二、L2正則化

先看看tf.contrib.layers.l2_regularizer(weight_decay)都執行了什麼：

import tensorflow as tf
sess=tf.Session()
weight_decay=0.1
tmp=tf.constant([0,1,2,3],dtype=tf.float32)
"""
l2_reg=tf.contrib.layers.l2_regularizer(weight_decay)
a=tf.get_variable("I_am_a",regularizer=l2_reg,initializer=tmp) 
"""
#**上面程式碼的等價程式碼
a=tf.get_variable("I_am_a",initializer=tmp)
a2=tf.reduce_sum(a*a)*weight_decay/2;
a3=tf.get_variable(a.name.split(":")[0]+"/Regularizer/l2_regularizer",initializer=a2)
tf.add_to_collection(tf.GraphKeys.REGULARIZATION_LOSSES,a2)
#**
sess.run(tf.global_variables_initializer())
keys = tf.get_collection(tf.GraphKeys.REGULARIZATION_LOSSES)
for key in keys:
  print("%s : %s" %(key.name,sess.run(key)))

我們很容易可以模擬出tf.contrib.layers.l2_regularizer都做了什麼，不過會讓程式碼變醜。以下比較完整實現L2 正則化。

import tensorflow as tf
sess=tf.Session()
weight_decay=0.1                                                #(1)定義weight_decay
l2_reg=tf.contrib.layers.l2_regularizer(weight_decay)           #(2)定義l2_regularizer()
tmp=tf.constant([0,1,2,3],dtype=tf.float32)
a=tf.get_variable("I_am_a",regularizer=l2_reg,initializer=tmp)  #(3)建立variable，l2_regularizer複製給regularizer引數。
                                                                #目測REXXX_LOSSES集合
#regularizer定義會將a加入REGULARIZATION_LOSSES集合
print("Global Set:")
keys = tf.get_collection("variables")
for key in keys:
  print(key.name)
print("Regular Set:")
keys = tf.get_collection(tf.GraphKeys.REGULARIZATION_LOSSES)
for key in keys:
  print(key.name)
print("--------------------")
sess.run(tf.global_variables_initializer())
print(sess.run(a))
reg_set=tf.get_collection(tf.GraphKeys.REGULARIZATION_LOSSES)   #(4)則REGULARIAZTION_LOSSES集合會包含所有被weight_decay後的引數和，將其相加
l2_loss=tf.add_n(reg_set)
print("loss=%s" %(sess.run(l2_loss)))
"""
此處輸出0.7,即:
   weight_decay*sigmal(w*2)/2=0.1*(0*0+1*1+2*2+3*3)/2=0.7
其實程式碼自己寫也很方便，用API看著比較正規。
在網路模型中，直接將l2_loss加入loss就好了。(loss變大，執行train自然會decay)
"""

[Tensorflow]L2正則化和collection【tf.GraphKeys】

L2-Regularization 實現的話，需要把所有的引數放在一個集合內，最後計算loss時，再減去加權值。相比自己亂搞，程式碼一團糟，Tensorflow 提供了更優美的實現方法。一、tf.GraphKeys ：多個包含Variables(Tensor)集合

使用L2正則化和平均滑動模型的LeNet-5MNIST手寫數字識別模型

put 輸出矩陣 conv2 cross -m collect variable global 空間使用L2正則化和平均滑動模型的LeNet-5MNIST手寫數字識別模型覺得有用的話,歡迎一起討論相互學習~Follow Me 參考文獻Tensorflow實戰Googl

【通俗易懂】機器學習中 L1 和 L2 正則化的直觀解釋

機器學習中，如果引數過多，模型過於複雜，容易造成過擬合（overfit）。即模型在訓練樣本資料上表現的很好，但在實際測試樣本上表現的較差，不具備良好的泛化能力。為了避免過擬合，最常用的一種方法是使用使用正則化，例如 L1 和 L2 正則化。但是，正則化項是如

【tensorflow 學習】給LSTM加上L2正則化

首先，用tf.trainable_variables()得到所有weights和bias，然後，用tf.nn.l2_loss()計算L2 norm，求和之後作為正則項加給原來的cost function tv = tf.trainable_vari

L1和L2正則化直觀理解

正則化是用於解決模型過擬合的問題。它可以看做是損失函式的懲罰項，即是對模型的引數進行一定的限制。應用背景：當模型過於複雜，樣本數不夠多時，模型會對訓練集造成過擬合，模型的泛化能力很差，在測試集上的精度遠低於訓練集。這時常用正則化來解決過擬合的問題，常用的正則化有L1正則化和L2

L1正則化和L2正則化

在機器學習中，我們非常關心模型的預測能力，即模型在新資料上的表現，而不希望過擬合現象的的發生，我們通常使用正則化（regularization）技術來防止過擬合情況。正則化是機器學習中通過顯式的控制模型複雜度來避免模型過擬合、確保泛化能力的一種有效方式。如果將模型原始的假設空間比作“天空”，那麼天空飛翔的“鳥

批歸一化（Batch Normalization）、L1正則化和L2正則化

from: https://www.cnblogs.com/skyfsm/p/8453498.html https://www.cnblogs.com/skyfsm/p/8456968.html BN是由Google於2015年提出，這是一個深度神經網路訓練的技巧，它不僅可以加快了

L1和L2正則化。L1為什麼能產生稀疏值，L2更平滑

參考部落格：https://zhuanlan.zhihu.com/p/35356992 　　　　　https://zhuanlan.zhihu.com/p/25707761 　　　　　https://www.zhihu.com/question/37096933/answer/70426653 　　首先

dropout和L1，L2正則化的理解筆記

理解dropout from http://blog.csdn.net/stdcoutzyx/article/details/49022443 123 開篇明義，dropout是指在深度學習網路的訓練過程中，對於神經網路單元，按照一定的概率將其暫時從網路

Tensorflow第六課--基於L2正則化損失函式的5層神經網路

這幾天一直在看Tensorflow：實戰google深度學習框架。感覺這本書真的寫的很好，尤其是對於Tensorflow之前毫無所知的我，通過這本書也能學懂並且瞭解很多。今天我主要是學習了損失函式。新增損失函式的主要目的是解決在訓練過程中的過擬合問題。正則化的思想就是在損失函

L1正則化和L2正則化比較

機器學習監督演算法的基本思路是讓擬合的模型儘量接近真實資料，換句更通俗的話, 要讓我們的模型儘量簡單又能很好的反應已知資料之間關係。在這個貼近的過程可能存在兩個截然相反的問題：過擬合和擬合不夠。擬合不夠是模型預測值與真實值之間誤差較大，上篇文章中提到梯度下降就是討論解決問題（求損失函式最小）。而正則化

對L1正則化和L2正則化的理解

一、奧卡姆剃刀(Occam's razor)原理：在所有可能選擇的模型中，我們應選擇能夠很好的解釋資料，並且十分簡單的模型。從貝葉斯的角度來看，正則項對應於模型的先驗概率。可以假設複雜模型有較小的先驗概率，簡單模型有較大的先驗概率。二、正則化項

l1正則化的稀疏表示和l2正則化的協同表示

這些天一直在看稀疏表示和協同表示的相關論文，特此做一個記錄：這篇文章將主要討論以下的問題： 1.稀疏表示是什麼？ 2.l1正則化對於稀疏表示的幫助是什麼，l0,l1,l2,無窮範數的作用？ 3.稀疏表示的robust為什麼好？ 4.l2正則化的協同表

L1和L2正則化區別

1. L1和L2的定義 L1正則化，又叫Lasso Regression 如下圖所示，L1是向量各元素的絕對值之和 L2正則化，又叫Ridge Regression 如下圖所示，L2是向量各元素的平方和 2. L1和L2的異同點相同點：都用於避免過擬合不同點：L

L2正則化—tensorflow實現

L2正則化是一種減少過擬合的方法，在損失函式中加入刻畫模型複雜程度的指標。假設損失函式是J(θ)，則優化的是J(θ)+λR(w)，R(w)=∑ni=0|w2i|。在tensorflow中的具體實現過

吳恩達-深度學習-課程筆記-8: 超參數調試、Batch正則化和softmax( Week 3 )

erp 搜索給定 via 深度 mode any .com sim 1 調試處理( tuning process ) 如下圖所示，ng認為學習速率α是需要調試的最重要的超參數。其次重要的是momentum算法的β參數（一般設為0.9），隱藏單元數和mini-batch的

機器學習之路： python線性回歸過擬合 L1與L2正則化

擬合 python sco bsp orm AS score 未知數 spa git：https://github.com/linyi0604/MachineLearning 正則化：提高模型在未知數據上的泛化能力避免參數過擬合正則化常用的方法：在目

l2-loss，l2範數，l2正則化，歐式距離

access src 梯度 com inf content 開平 nbsp alt 歐式距離： l2範數： l2正則化： l2-loss(也叫平方損失函數)： http://openaccess.thecvf.com/content_cvpr_2017/papers

L2正則化項為什麼能防止過擬合學習筆記

https://www.cnblogs.com/alexanderkun/p/6922428.html L2 regularization（權重衰減） L2正則化就是在代價函式後面再加上一個正則化項： C0代表原始的代價函式，後面那一項就是L2正則化項，它是這樣來的：所有引數w的平

L1，L2正則化

正則化引入的思想其實和奧卡姆剃刀原理很相像，奧卡姆剃刀原理：切勿浪費較多東西，去做，用較少的東西，同樣可以做好的事情。正則化的目的：避免出現過擬合（over-fitting）經驗風險最小化 + 正則化項 = 結構風險最小化經驗風險最小化（ERM），是為了讓擬合的誤差足夠小，即：對訓

[Tensorflow]L2正則化和collection【tf.GraphKeys】

一、tf.GraphKeys ： 多個包含Variables(Tensor)集合

二、L2正則化

相關推薦

一、tf.GraphKeys ：多個包含Variables(Tensor)集合