TensorFlow——dropout和正則化的相關方法

阿新 • • 發佈：2019-06-02

1.dropout

dropout是一種常用的手段，用來防止過擬合的，dropout的意思是在訓練過程中每次都隨機選擇一部分節點不要去學習，減少神經元的數量來降低模型的複雜度，同時增加模型的泛化能力。雖然會使得學習速度降低，因而需要合理的設定保留的節點數量。

在TensorFlow中dropout的函式原型如下：def dropout(x, keep_prob, noise_shape=None, seed=None, name=None)，各個引數的意義如下：

x：輸入的模型節點

keep_prob：保持節點的比率，如果為1，則表示全部節點參與學習，如果為0.8，則表示丟棄20%的節點。

noise_shape：設定指定的x中參與dropout計算的維度，如果為None，則表示所有的維度都參與計算，也可以設定某個維度，例如：x的形狀為[ n, len, w, ch]，使用noise_shape為[n, 1, 1, ch]，這表明會對x中的第二維度和第三維度進行dropout。

dropout改變了神經網路的網路結構，它僅僅是屬於訓練時的方法，所以在進行測試時要將dropout的keep_porb的值為1。

x = tf.placeholder(tf.float32, [None, 784])
y = tf.placeholder(tf.float32, [None, 10])

keep_prob = tf.placeholder(tf.float32)

w1 = tf.Variable(tf.random_normal([784, 30]))
b1 = tf.Variable(tf.zeros([30]))
w_h_1 = tf.add(tf.matmul(x, w1), b1)
w_h_r_1 = tf.nn.sigmoid(w_h_1)
w_h_r_drop_1 = tf.nn.dropout(w_h_r_1, keep_prob=keep_prob)

w2 = tf.Variable(tf.random_normal([30, 30]))
b2 = tf.Variable(tf.zeros([30]))
w_h_2 = tf.add(tf.matmul(w_h_r_drop_1, w2), b2)
w_h_r_2 = tf.nn.sigmoid(w_h_2)
w_h_r_drop_2 = tf.nn.dropout(w_h_r_2, keep_prob=keep_prob)

w3 = tf.Variable(tf.random_normal([30, 30]))
b3 = tf.Variable(tf.zeros([30]))
w_h_3 = tf.add(tf.matmul(w_h_r_drop_2, w3), b3)
w_h_r_3 = tf.nn.sigmoid(w_h_3)
w_h_r_drop_3 = tf.nn.dropout(w_h_r_3, keep_prob=keep_prob)

w4 = tf.Variable(tf.random_normal([30, 10]))
b4 = tf.Variable(tf.zeros([10]))
w_h_4 = tf.add(tf.matmul(w_h_r_drop_3, w4), b4)
w_h_r_4 = tf.nn.softmax(w_h_4)
pred = tf.nn.dropout(w_h_r_4, keep_prob=keep_prob)


cost = tf.reduce_mean(tf.reduce_sum(tf.square(pred - y)))

feed_dict={x:batch_xs, y:batch_ys, keep_prob:0.7}

2.正則化

正則化是在神經網路計算損失值的過程中，在損失後面再加上一項。這樣損失值所代表的輸出與標準結果間的誤差就會受到干擾，導致學習引數w 和 b無法按照目標方向來調整，實現模型無法與樣本完全擬合，從而達到防止過擬合的效果。正則化主要有L1和L2正則，如下：

L1:所有學習引數w的絕對值的和

L2:所有學習引數w的平方和然後求平方根。

如此，損失函式表示式如下：

在TensorFlow中，已經封裝好了相應的函式，L2的正則化函式為：tf.nn.l2_loss(t, name=None)，L1的正則化函式需要自己組合，tf.reduce_sum(tf.abs(w))

L2 = tf.nn.l2_loss(w1) + tf.nn.l2_loss(w2) + tf.nn.l2_loss(w3) +tf.nn.l2_loss(w4)

cost = tf.reduce_mean(tf.reduce_sum(tf.square(pred - y))) + L2*0.01

在使用正則化的時候，我們為正則化項設定一個權重的係數，注意這個權重係數的值，可以通過不斷嘗試來確定權重係數的值。

TensorFlow——dropout和正則化的相關方法

TensorFlow——dropout和正則化的相關方法

tensorflow正則化新增方法整理

TensorFlow 中的正則化（Batch Normalization）詳解和實現程式碼

深度學習之激活函數、優化方法和正則化

【轉】正則化相關鏈接

容量、欠擬合、過擬合和正則化

L1與L2損失函式和正則化的區別

Batch 、weight decay、momentum、normalization和正則化的一些理解和借鑑

深度學習中的歸一化(normalization)和正則化(regularization)

歸一化、標準化和正則化的關係

神經網路與深度學習筆記5 過度擬合和正則化

正則化和正則化的思想

範數和正則化

深度學習小白——神經網路3（資料預處理，dropout，正則化）

L1和L2：損失函式和正則化

正則化方法 L1和L2 regularization 資料集擴增 dropout

機器學習 - 正則化方法：L1和L2 regularization、資料集擴增、dropout

正則化方法：L1和L2 regularization、資料集擴增、dropout

[一種通用的正則化方法Dropout] 深入理解Dropout正則化思想和實現方法

正則化方法/防止過擬合提高泛化能力的方法：L1和L2 regularization、資料集擴增、dropout

TensorFlow——dropout和正則化的相關方法

相關推薦