theano學習之正則化

阿新 • • 發佈：2018-12-28

先上程式碼：

from __future__ import print_function
import theano
from sklearn.datasets import load_boston#波士頓房價資料
import theano.tensor as T
import numpy as np
import matplotlib.pyplot as plt

#定義類層，套神經網路
class Layer(object):
    def __init__(self, inputs, in_size, out_size, activation_function=None):
        self.W = theano.shared(np.random.normal(0, 1, (in_size, out_size)))
        self.b = theano.shared(np.zeros((out_size, )) + 0.1)
        self.Wx_plus_b = T.dot(inputs, self.W) + self.b
        self.activation_function = activation_function
        if activation_function is None:
            self.outputs = self.Wx_plus_b
        else:
            self.outputs = self.activation_function(self.Wx_plus_b)

#對x各個特徵標準化處理
def minmax_normalization(data):
    xs_max = np.max(data, axis=0)
    xs_min = np.min(data, axis=0)
    xs = (1 - 0) * (data - xs_min) / (xs_max - xs_min) + 0
    return xs

#載入資料
np.random.seed(100)
x_data = load_boston().data
# minmax normalization, rescale the inputs
x_data = minmax_normalization(x_data)
y_data = load_boston().target[:, np.newaxis]#[:,np.newaxis]的意思是有列表結構變為矩陣形式
print(x_data)
print(y_data)

#把資料集分為訓練集，測試集，交叉驗證，檢驗模型是否學習好了，也可以用來篩選合適引數
x_train, y_train = x_data[:400], y_data[:400]
x_test, y_test = x_data[400:], y_data[400:]

x = T.dmatrix("x")#如果這一步中的x裡面沒被喂值，涉及到x的程式碼都是空的，因為沒資料去跑
y = T.dmatrix("y")#如果這一步中的x裡面沒被喂值，涉及到x的程式碼都是空的，因為沒資料去跑

#建立模型
l1 = Layer(x, 13, 50, T.tanh)
l2 = Layer(l1.outputs, 50, 1, None)

#代價的計算
cost = T.mean(T.square(l2.outputs - y))      #不加正則化的代價函式
# cost = T.mean(T.square(l2.outputs - y)) + 0.1 * ((l1.W ** 2).sum() + (l2.W ** 2).sum())  # with l2 regularization
# cost = T.mean(T.square(l2.outputs - y)) + 0.1 * (abs(l1.W).sum() + abs(l2.W).sum())  # with l1 regularization
gW1, gb1, gW2, gb2 = T.grad(cost, [l1.W, l1.b, l2.W, l2.b])

learning_rate = 0.01
train = theano.function(
    inputs=[x, y],
    updates=[(l1.W, l1.W - learning_rate * gW1),
             (l1.b, l1.b - learning_rate * gb1),
             (l2.W, l2.W - learning_rate * gW2),
             (l2.b, l2.b - learning_rate * gb2)])

compute_cost = theano.function(inputs=[x, y], outputs=cost)

#各種資料儲存
train_err_list = []
test_err_list = []
learning_time = []
for i in range(100):
    train(x_train, y_train)#把資料喂到網路中去訓練
    if i % 10 == 0:
        # record cost
        train_err_list.append(compute_cost(x_train, y_train))#用訓練資料計算代價，一旦執行這個程式碼，x和y中就有值了
        test_err_list.append(compute_cost(x_test, y_test))#用訓練資料計算代價，一旦執行這個程式碼，x和y中就有值了
        learning_time.append(i)

#畫出代價
plt.plot(learning_time, train_err_list, 'r-')
plt.plot(learning_time, test_err_list, 'b--')
plt.show()

結果：

以上程式碼用波士頓房價作為資料，實現正則化。

來源

theano學習之正則化

先上程式碼： from __future__ import print_function import theano from sklearn.datasets import load_boston#波士頓房價資料 import theano.tensor as T import numpy a

深度學習之正則化系列（2）：資料集增強（資料增廣）

讓機器學習模型泛化得更好的最好辦法是使用更多的資料進行訓練。當然，在實踐中，我們擁有的資料量是很有限的。解決這個問題的一種方法是建立假資料並新增到訓練集中。對於一些機器學習任務，建立新的假資料相當簡單。對分類來說這種方法是最簡單的。分類器需要一個複雜的高維輸入

機器學習之正則化（Regularization）

1. The Problem of Overfitting 1 還是來看預測房價的這個例子，我們先對該資料做線性迴歸，也就是左邊第一張圖。如果這麼做，我們可以獲得擬合數據的這樣一條直線，但是，實際上這並不是一個很好的模型。我們看看這些資料，很明顯，隨著房子面積增大，住房價格的變化趨於穩定或者說越往右越平緩

系統學習機器學習之正則化（二）

監督機器學習問題無非就是“minimizeyour error while regularizing your parameters”，也就是在規則化引數的同時最小化誤差。最小化誤差是為了讓我們的模型擬合我們的訓練資料，而規則化引數是防止我們的模型過分擬合我們的訓練資料。多麼簡約的哲學啊！因為引數太多，會導致

機器學習演算法之正則化

>By joey周琦正則化假設目標函式為 J J, 比如 J J可以是對數似然函式的負數形式，特徵 i i的係數為 wi w_i, 係數向量 w=[w1,...,

機器學習總結之正則化

之前學習總是搞不懂正則化到底什麼玩意兒，就知道它的公式，它能降低過擬合，但是，它到底為什麼能降低過擬合呢，看了李航老師的《統計學習方法》有了些許體悟。以什麼方式呈現呢，就以問答的方式吧，三省吾身，挺好的。1 為什麼資料量過小會導致過擬合，為什麼正則化能夠降低過擬合？因為本質上

python3學習之正則

python##正則表達式# . 任意一個# * 零及以上# ^ 以某某開頭# $ 從某某結尾import re # # s = "sdfjkslfjlkaaa1923891a" r = re.findall(‘^s.*a$‘,s) print(r)python3學習之正則

python學習之正則表達式

python學習之正則表達式一、什麽是正則？通過re模塊匹配來匹配需要的字符串二、正則匹配模式模式描述 \w 匹配字母數字下劃線 \W 匹配非字母數字下劃線 \s 匹配空白字符,等價於[\t\n\r\n] \S 匹配任意非空字符

Java學習之正則表達式

反向反向引用換行 find() java正則表達式單個控制字符正則嘗試　　Java正則表達式字符串模式。　　正則表達式可以用來搜索、編輯和處理文本。　　正則表達式不盡限於一種語言，但在每一種語言中又細微的差別。 java.util.regex包中主要有這3

HIVE之正則化詳解

div case details class null false TP CA hive 有大神寫的很好了，我借花獻佛，有興趣，看鏈接，在此不再贅述。想要學習Hive正則表達式重點應該是正則表達式的表示方式，只有正則表達式使用溜了，hive正則那就是小case. 附參考博文

shell學習之正則表達式

passwd 過濾表達式 roo 輸出 shel 數字和字母 {} 轉義一、grep使用...語法： grep [-cinvABC] ‘word‘ filename -c ：打印符合要求的行數 -i ：忽略大小寫 -n ：在輸出符合要求的行的同時連同行號一起輸出

Shell學習之正則表示式-----grep

grep 1. 作用 Linux系統中grep命令是一種強大的文字搜尋工具，它能使用正則表示式搜尋文字，並把匹配的行打印出來。grep全稱是Global Regular Expression Print，表示全域性正則表示式版本，它的使用許可權是所有使用者。 grep家族包括gre

機器學習：正則化技術

正則化（regularization）技術是機器學習中十分常用的技術，它在不同的模型或者情景中以不同的名字出現，比如以L2正則化為例，如果將L2正則化用於linear regression，那麼這就對應了ridge regression；如果將L2正則化用於神經網路（neural network），

【機器學習】正則化方法

正則化方法：L1和L2 regularization、資料集擴增、dropout 正則化方法：防止過擬合，提高泛化能力，減少部分特徵的權重，進而忽略部分無關緊要的特徵。因為考慮全部特徵會將噪聲加入進去，也就導致過擬合。在訓練資料不夠多時，或者overtraining時，常常會導致overf

深度學習基礎--正則化與norm--區域性響應歸一化層(Local Response Normalization, LRN)

區域性響應歸一化層(Local Response Normalization, LRN) 區域性響應歸一化層完成一種“臨近抑制”操作，對區域性輸入區域進行歸一化。該層實際上證明已經沒啥用了，一般也不用了。參考資料：見郵件公式與計算該層需要的引數包括：

深度學習基礎--正則化與norm--Ln正則化綜述

L1正則化 L1範數是指向量中各個元素的絕對值之和。對於人臉任務原版的人臉畫素是 64*64，顯然偏低，但要提高人臉清晰度，並不能僅靠提高圖片的解析度，還應該在訓練方法和損失函式上下功夫。眾所周知，簡單的 L1Loss 是有數學上的均值性的，會導致模糊。

深度學習基礎--正則化與norm--L1範數與L2範數的聯絡

L1範數與L2範數的聯絡假設需要求解的目標函式為：E(x) = f(x) + r(x) 其中f(x)為損失函式，用來評價模型訓練損失，必須是任意的可微凸函式，r(x)為規範化約束因子，用來對模型進行限制。根據模型引數的概率分佈不同，r(x)一般有: 1）L1正規化

深度學習基礎--正則化與norm--正則化(Regularization)

正則化(Regularization) 一種防止過擬合，提高泛化能力的技巧，因此演算法正則化的研究成為機器學習中主要的研究主題。此外，正則化還是訓練引數數量大於訓練資料集的深度學習模型的關鍵步驟。正則化可以避免演算法過擬合，過擬合通常發生在演算法學習的輸入資料無法反應真實的分佈

深度學習基礎--正則化與norm--正則化技術

正則化技術一種防止過擬合，提高泛化能力的技巧，因此演算法正則化的研究成為機器學習中主要的研究主題。此外，正則化還是訓練引數數量大於訓練資料集的深度學習模型的關鍵步驟。正則化可以避免演算法過擬合，過擬合通常發生在演算法學習的輸入資料無法反應真實的分佈且存在一些噪聲的情況。

深度學習：正則化（L2、dropout）

一、在瞭解正則化之前，先引入一個概念“過擬合” 定義給定一個假設空間H，一個假設h屬於H，如果存在其他的假設h’屬於H,使得在訓練樣例上h的錯誤率比h’小，但在整個例項分佈上h’比h的錯誤率小，那麼就說假設h過度擬合訓練資料。也就是說一個假設在訓練資料上能夠獲

theano學習之正則化

相關推薦