TensorFlow HOWTO 1.2 LASSO、嶺和 Elastic Net

阿新 • • 發佈：2018-11-29

1.2 LASSO、嶺和 Elastic Net

當引數變多的時候，就要考慮使用正則化進行限制，防止過擬合。

操作步驟

匯入所需的包。

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
import sklearn.datasets as ds
import sklearn.model_selection as ms

匯入資料，並進行預處理。我們使用波士頓資料集所有資料的全部特徵。

boston = ds.load_boston()

x_ = boston. 
data
y_ = np.expand_dims(boston.target, 1)

x_train, x_test, y_train, y_test = \
    ms.train_test_split(x_, y_, train_size=0.7, test_size=0.3)
    
mu_train = x_train.mean(0)
sigma_train = x_train.std(0)
x_train = (x_train - mu_train) / sigma_train
x_test = (x_test - mu_train) / sigma_train

定義超引數。

n_input = 
 13
n_epoch = 2000
lr = 0.05
lam = 0.1
l1_ratio = 0.5

變數	含義
`n_input`	樣本特徵數
`n_epoch`	迭代數
`lr`	學習率
`lam`	正則化係數
`l1_ratio`	L1 正則化比例。如果它是 1，模型為 LASSO 迴歸；如果它是 0，模型為嶺迴歸；如果在 01 之間，模型為 Elastic Net。

搭建模型。

變數	含義
`x`	輸入
`y`	真實標籤
`w`	權重
`b`	偏置
`z`	輸出，也就是標籤預測值

x = tf.placeholder(tf.float64, [None, n_input])
y = tf.placeholder(tf.float64, [None, 1])
w = tf.Variable(np.random.rand(n_input, 1))
b = tf.Variable(np.random.rand(1, 1))
z = x @ w + b

定義損失、優化操作、和 R 方度量指標。

我們在 MSE 基礎上加上兩個正則項：

$\begin{matrix} L_1 = \lambda_1 \|w\|_1 \\ L_2 = \lambda_2 \|w\|^2 \\ L = L_{MSE} + L_1 + L_2 \end{matrix}$

變數	含義
`mse_loss`	MSE 損失
`l1_loss`	L1 損失
`l2_loss`	L2 損失
`loss`	總損失
`op`	優化操作
`y_mean`	`y`的均值
`r_sqr`	R 方值

mse_loss = tf.reduce_mean((z - y) ** 2)
l1_loss = lam * l1_ratio * tf.reduce_sum(tf.abs(w))
l2_loss = lam * (1 - l1_ratio) * tf.reduce_sum(w ** 2)
loss = mse_loss + l1_loss + l2_loss
op = tf.train.AdamOptimizer(lr).minimize(loss)

y_mean = tf.reduce_mean(y)
r_sqr = 1 - tf.reduce_sum((y - z) ** 2) / tf.reduce_sum((y - y_mean) ** 2)

使用訓練集訓練模型。

losses = []
r_sqrs = []

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for e in range(n_epoch):
        _, loss_ = sess.run([op, loss], feed_dict={x: x_train, y: y_train})
        losses.append(loss_)

使用測試集計算 R 方。

        r_sqr_ = sess.run(r_sqr, feed_dict={x: x_test, y: y_test})
        r_sqrs.append(r_sqr_)

每一百步列印損失和度量值。

        if e % 100 == 0:
            print(f'epoch: {e}, loss: {loss_}, r_sqr: {r_sqr_}')

輸出：

epoch: 0, loss: 601.4143942455931, r_sqr: -5.632461200109857
epoch: 100, loss: 337.83817233312953, r_sqr: -2.8921127959091235
epoch: 200, loss: 205.95485710264686, r_sqr: -1.3905038082279204
epoch: 300, loss: 122.56157140781264, r_sqr: -0.4299323503419834
epoch: 400, loss: 73.34245865955972, r_sqr: 0.13473129501015224
epoch: 500, loss: 46.62652385307641, r_sqr: 0.4391669119513518
epoch: 600, loss: 33.418871666746185, r_sqr: 0.5880392599137905
epoch: 700, loss: 27.51559958401544, r_sqr: 0.6533498987634062
epoch: 800, loss: 25.14275351335227, r_sqr: 0.6787325098436232
epoch: 900, loss: 24.28818622078879, r_sqr: 0.6872955402664112
epoch: 1000, loss: 24.01321943982539, r_sqr: 0.689688496343003
epoch: 1100, loss: 23.93439017638524, r_sqr: 0.6901611522536858
epoch: 1200, loss: 23.914316369424643, r_sqr: 0.690163604062231
epoch: 1300, loss: 23.909792588385457, r_sqr: 0.6901031472929803
epoch: 1400, loss: 23.908894366923214, r_sqr: 0.6900616479035429
epoch: 1500, loss: 23.90873804289015, r_sqr: 0.6900411329923608
epoch: 1600, loss: 23.90871433783755, r_sqr: 0.6900324529674866
epoch: 1700, loss: 23.908711226897406, r_sqr: 0.690029151344134
epoch: 1800, loss: 23.908710876248833, r_sqr: 0.6900280037335323
epoch: 1900, loss: 23.908710842591514, r_sqr: 0.6900276378081478

繪製訓練集上的損失。

plt.figure()
plt.plot(losses)
plt.title('Loss on Training Set')
plt.xlabel('#epoch')
plt.ylabel('MSE')
plt.show()

繪製測試集上的 R 方。

plt.figure()
plt.plot(r_sqrs)
plt.title('$R^2$ on Testing Set')
plt.xlabel('#epoch')
plt.ylabel('$R^2$')
plt.show()

擴充套件閱讀

斯坦福 CS229 筆記：七、正則化

TensorFlow HOWTO 1.2 LASSO、嶺和 Elastic Net

1.2 LASSO、嶺和 Elastic Net 當引數變多的時候，就要考慮使用正則化進行限制，防止過擬合。操作步驟匯入所需的包。 import tensorflow as tf import numpy as np import matplotlib.pyplot

《Java虛擬機原理圖解》 1.2.3、Class文件裏的常量池具體解釋（下）

and 支持術語一個 handle per ret mod make NO9.類中引用到的field字段在常量池中是如何描寫敘述的？(CONSTANT_Fieldref_info, CONSTANT_Name_Type_info) 一般而言。我們在定義

求1+2!+3!+...+20!的和

image nbsp png src mage bsp img ima 技術結果求1+2!+3!+...+20!的和

381 Insert Delete GetRandom O(1) - Duplicates allowed O(1) 時間插入、刪除和獲取隨機元素 - 允許重復

etc size 初始結構 randomize lse 相同 HERE 時間復雜度設計一個支持在平均時間復雜度 O(1) 下，執行以下操作的數據結構。註意: 允許出現重復元素。 insert(val)：向集合中插入元素 val。 remove(val)：

【Python3練習題 020】求1+2!+3!+...+20!的和

sum div spa port ons fun plus 函數 UNC 方法一 import functools sum = 0 for i in range(1,21): sum = sum + functools.reduce(lambda x,y: x

python 求階乘之和。求1+2!+3!+...+20!的和

blank HR IV sharp ML 術語 lis get 功能階乘：也是數學裏的一種術語；階乘指從1乘以2乘以3乘以4一直乘到所要求的數；在表達階乘時，就使用“！”來表示。如h階乘，就表示為h!；階乘一般很難計算，因為積都很大。分析：1、階乘的計算就是比較麻煩的一

6.1.2.9 文本和字體

行高 size its 技術 erl ont 字體 info 分享字號： font-size: 20px; 默認是16px 　　px: 像素　　rem em % 移動端使用的單位字形： font-weight: bold; 　　normal 　　bol

java 求 1!+2!+3!+....+10!的和為

com args println ++ system ack main 輸出初始 package com.xuyigang1234.chp01; //1!+2!+3!+....+10!的和 public class Demo5 { public static v

Tensorflow入門----占位符、常量和Session

存在大小 operation hold 而是表示意思占位符不同安裝好TensorFlow之後，開一個python環境，就可以開始運行和使用TensorFlow了。先給一個實例， #先導入TensorFlowimport tensorflow as tf # C

[.net core自我修煉2]SQL、LINQ和Lambda表示式

隨便說說自己想到什麼就記錄下來了，都是自己遇到的技術點，湊合看吧。在寫後端的時候，最常用的是Lambda表示式，這就記錄一下SQL、LINQ和Lambda的不同之處。參考資料：https://blog.csdn.net/u010926964/article/details/46240

TensorFlow HOWTO 1.4 Softmax 迴歸

1.4 Softmax 迴歸 Softmax 迴歸可以看成邏輯迴歸在多個類別上的推廣。操作步驟匯入所需的包。 import tensorflow as tf import numpy as np import matplotlib as mpl import matp

TensorFlow HOWTO 1.3 邏輯迴歸

1.3 邏輯迴歸將線性迴歸的模型改一改，就可以用於二分類。邏輯迴歸擬合樣本屬於某個分類，也就是樣本為正樣本的概率。操作步驟匯入所需的包。 import tensorflow as tf import numpy as np import matplotlib as

TensorFlow HOWTO 1.1 線性迴歸

1.1 線性迴歸線性迴歸是你能用 TF 搭出來的最簡單的模型。操作步驟匯入所需的包。 import tensorflow as tf import numpy as np import matplotlib.pyplot as plt import sklearn.

長短期記憶（LSTM）系列_2.1~2.3、用遞迴神經網路簡要介紹序列預測模型

前置課程 https://machinelearningmastery.com/sequence-prediction/ https://machinelearningmastery.com/gentle-introduction-long-short-term-memory-network

Linux知識點總結之磁碟儲存 1.2 磁碟儲存結構和分割槽

磁碟儲存結構和分割槽 ①主引導扇區的結構 ②磁碟引導基本過程 ③為什麼Linux作業系統只有四個分割槽 ④為什麼一個擴充套件分割槽可以劃分成多個邏輯分割槽 ⑤如何對磁碟分割槽 ⑥新增硬碟步驟 ⑦生產壞境分割槽建議 ⑧Linux為什麼要分割槽和格式化

第1章計算機、程式和JAVA概述

計算機是儲存和處理資料的電子裝置。計算機包括竣件和軟體兩部分。硬體是計算機中可以觸控到的物理部分。計算機程式，也就是通常所說的軟體，是一些不可見的指令，它們控制硬體完成任務。計算機程年設計就是編寫讓計算機執行的指令（即程式碼) 中央處理器（CPU)是計算機的大腦。它從記憶體獲取指令並且執行這些指令

python筆記 1-2 liunx基本操作 -和命令

day 1 liunx 常用命令 ls 命令檢視 ls : 以列表方式檢視當前檔案內容 ls -a : 檢視所有內容 (包含隱藏檔案 , 隱藏檔案是帶 . 的檔案) ls -l : 檢視詳細資訊 (包含可讀寫,許可權大小用量 -h 是友好模式顯示) ls -h ; 友好模式

使用遞迴函式，計算1+2+3+……+n的和

#for迴圈 n = int(input('請輸入一個正整數：')) sum = 0 for i in range(n + 1): sum += i print(sum) #遞迴呼叫 n = int(input('請輸入一個正整數：')) def Sum(n): if n

併發程式設計(2)-程序、併發和並行講解

概要: 程序併發和並行同步\非同步\阻塞\非阻塞程序的建立、結束與併發的實現一.程序講解　　程序（Process）是計算機中的程式關於某資料集合上的一次執行活動，是系統進行資源分配和排程的基本單位，是作業系統結構的基礎。在早期面向程序設計的計算機結構中，程

《HyperLedger Fabric 實戰》—— 十七、升級 Fabric 1.2 —— 6、部署驗證合約

1、載入智慧合約（以 211 機器為例）拷貝～/fabric/examples/chaincode/go/資料夾下的example02及marbles02兩個目錄到~/fabric/aberic/chaincode/go/目錄下。重啟 Peer 服務。 d

TensorFlow HOWTO 1.2 LASSO、嶺和 Elastic Net

1.2 LASSO、嶺和 Elastic Net

操作步驟

擴充套件閱讀

相關推薦