《用Python玩轉數據》項目—線性回歸分析入門之波士頓房價預測（二）

阿新 • • 發佈：2018-11-25

store mil ima 超參數 eval app lac on() break

接上一部分，此篇將用tensorflow建立神經網絡，對波士頓房價數據進行簡單建模預測。

二、使用tensorflow擬合boston房價datasets

1、數據處理依然利用sklearn來分訓練集和測試集。

2、使用一層隱藏層的簡單網絡，試下來用當前這組超參數收斂較快，準確率也可以。

3、激活函數使用relu來引入非線性因子。

4、原本想使用如下方式來動態更新lr，但是嘗試下來效果不明顯，就索性不要了。

def learning_rate(epoch):
    if epoch < 200:
        return 0.01
    if epoch < 400:
        return 0.001
    if epoch < 800:
        return 1e-4

好了，廢話不多說了，看代碼如下：

from sklearn import datasets
from sklearn.model_selection import train_test_split
import os
import matplotlib.pyplot as plt
import numpy as np
import tensorflow as tf

dataset = datasets.load_boston()
x = dataset.data
target = dataset.target
y = np.reshape(target,(len(target), 1))

x_train, x_verify, y_train, y_verify = train_test_split(x, y, random_state=1)
y_train = y_train.reshape(-1)
train_data = np.insert(x_train, 0, values=y_train, axis=1)


def r_square(y_verify, y_pred):
    var = np.var(y_verify)
    mse = np.sum(np.power((y_verify-y_pred.reshape(-1,1)), 2))/len(y_verify)
    res = 1 - mse/var
    print(‘var:‘, var)
    print(‘MSE-ljj:‘, mse)
    print(‘R2-ljj：‘, res)


EPOCH = 3000
lr = tf.placeholder(tf.float32, [], ‘lr‘)
x = tf.placeholder(tf.float32, shape=[None, 13], name=‘input_feature_x‘)
y = tf.placeholder(tf.float32, shape=[None, 1], name=‘input_feature_y‘)

W = tf.Variable(tf.truncated_normal(shape=[13, 10], stddev=0.1))
b = tf.Variable(tf.constant(0., shape=[10]))

W2 = tf.Variable(tf.truncated_normal(shape=[10, 1], stddev=0.1))
b2 = tf.Variable(tf.constant(0., shape=[1]))


with tf.Session() as sess:
    hidden1 = tf.nn.relu(tf.add(tf.matmul(x, W), b))

    y_predict = tf.add(tf.matmul(hidden1, W2), b2)
    loss = tf.reduce_mean(tf.reduce_sum(tf.pow(y-y_predict,2), reduction_indices=[1]))
    print(loss.shape)
    train = tf.train.AdamOptimizer(learning_rate=lr).minimize(loss)

    sess.run(tf.global_variables_initializer())
    saver = tf.train.Saver()
    W_res = 0
    b_res = 0
    try:
        last_chk_path = tf.train.latest_checkpoint(checkpoint_dir=‘/home/ljj/PycharmProjects/mooc/train_record‘)
        saver.restore(sess, save_path=last_chk_path)
    except:
        print(‘no save file to recover-----------start new train instead--------‘)

        loss_list = []
        over_flag = 0
        for i in range(EPOCH):
            if over_flag ==1:
                    break
            y_t = train_data[:, 0].reshape(-1, 1)
            _, W_res, b_res, loss_train = sess.run([train, W, b, loss],
                                                   feed_dict={x: train_data[:, 1:],
                                                              y: y_t,
                                                              lr: 0.01})

            checkpoint_file = os.path.join(‘/home/ljj/PycharmProjects/mooc/train_record‘, ‘checkpoint‘)
            saver.save(sess, checkpoint_file, global_step=i)
            loss_list.append(loss_train)
            if loss_train < 0.2:
                over_flag = 1
                break
            if i %500 == 0:
                print(‘EPOCH = {:}, train_loss ={:}‘.format(i, loss_train))
            if i % 500 == 0:
                r = loss.eval(session=sess, feed_dict={x: x_verify,
                                                       y: y_verify,
                                                       lr: 0.01})
                print(‘verify_loss = ‘,r)
            np.random.shuffle(train_data)

        plt.plot(range(len(loss_list)-1), loss_list[1:], ‘r‘)
        plt.show()

    print(‘final loss = ‘,loss.eval(session=sess, feed_dict={x: x_verify,
                                           y: y_verify,
                                           lr: 0.01}))

    y_pred = sess.run(y_predict, feed_dict={x: x_verify,
                                           y: y_verify,
                                           lr: 0.01})

    plt.subplot(2,1,1)
    plt.xlim([0,50])
    plt.plot(range(len(y_verify)), y_pred,‘b--‘)
    plt.plot(range(len(y_verify)), y_verify,‘r‘)
    plt.title(‘validation‘)

    y_ss = sess.run(y_predict, feed_dict={x: x_train,
                                           y: y_train.reshape(-1, 1),
                                           lr: 0.01})
    plt.subplot(2,1,2)
    plt.xlim([0,50])
    plt.plot(range(len(y_train)), y_ss,‘r--‘)
    plt.plot(range(len(y_train)), y_train,‘b‘)
    plt.title(‘train‘)

    plt.savefig(‘tf.png‘)
    plt.show()

    r_square(y_verify, y_pred)

訓練了大概3000個epoch後，保存模型，之後可以多次訓練，但是loss基本收斂了，沒有太大變化。

輸出結果如下：

final loss = 15.117827
var: 99.0584735569471
MSE-ljj: 15.11782691349897
R2-ljj： 0.8473848185757882

技術分享圖片

從圖像上看，擬合效果也是一般，再拿一個放大版本的validation圖，同樣取前50個樣本，這樣方便和之前的線性回歸模型對比。

技術分享圖片

最後我們還是用數據來說明：

tf模型結果中，

R2：0.847 > 0. 779

MSE：15.1 < 21.8

都比sklearn的線性回歸結果要好。所以，此tf模型對波士頓房價數據的可解釋性更強。

def learning_rate(epoch):
    if epoch < 200:
        return 0.01
if epoch < 400:
        return 0.001
if epoch < 800:
        return 1e-4

《用Python玩轉數據》項目—線性回歸分析入門之波士頓房價預測（二）

store mil ima 超參數 eval app lac on() break 接上一部分，此篇將用tensorflow建立神經網絡，對波士頓房價數據進行簡單建模預測。二、使用tensorflow擬合boston房價datasets 1、數據處理依然利用sklearn

《用Python玩轉資料》專案—線性迴歸分析入門之波士頓房價預測（二）

接上一部分，此篇將用tensorflow建立神經網路，對波士頓房價資料進行簡單建模預測。二、使用tensorflow擬合boston房價datasets 1、資料處理依然利用sklearn來分訓練集和測試集。 2、使用一層隱藏層的簡單網路，試下來用當前這組超引數收斂較快，準確率也可以。 3、啟用函式

2018最新大神教你用Python玩轉數據視頻教程

data arr 學習者 ui組件 array 字符玩轉統計 afr 本課程共分為5個模塊(實際課時為8周)：Module 01: Python基礎本模塊主要討論Python的基本語言結構、數據類型、基本運算、條件和循環、函數和模塊等內容，用它們就可以寫一些有用的程序了

用SQL玩轉數據挖掘之MADlib（一）——安裝

system wan 商品 ase 關聯規則挖掘樹模型 ats 調用 ability 　　一、MADlib簡介　　　　MADlib是Pivotal公司與伯克利大學合作的一個開源機器學習庫，提供了精確的數據並行實現、統計和機器學習方法對結構化和非結構化數據進行分析，主要目的

MongoDB與python交互！這才是正確玩轉數據庫的正確方式！

恢復數據 cati ring img step ica BE ODB enable 1.Pymongo PyMongo是Mongodb的Python接口開發包，是使用python和Mongodb的推薦方式。官方文檔 2.安裝通過ObjectId來查找 >

Python學習筆記（十五）用Python獲取本地數據

cname lin txt .py ora 系統筆記緩沖 log f1 = open(r‘E:\Python\Data\data1.txt‘) #讀取data1.txt文件，使用系統默認緩沖區大小, 為了讀取快點，使用緩存吧！

kaggle入門項目：Titanic存亡預測（二）數據處理

理解 ima 簡單標識符數據處理 let ger 好的元素原kaggle比賽地址：https://www.kaggle.com/c/titanic 原kernel地址：A Data Science Framework: To Achieve 99% Accuracy

第二十四篇玩轉數據結構——隊列（Queue）

stat 基礎 ann move 打印圖片 data image 線性 1.. 隊列基礎隊列也是一種線性結構；相比數組，隊列所對應的操作數是隊列的子集；隊列只允許從一端（隊尾）添加元素，從另一端（隊首）取出元素；

第二十六篇玩轉數據結構——二分搜索樹

success min() minimum mage 後續遍歷常用 illegal argument 排列 1.. 二叉樹跟鏈表一樣，二叉樹也是一種動態數據結構，即，不需要在創建時指定大小。跟鏈表不同的是，二叉樹中的每個節點，除了要存放元素e，它還

第二十七篇玩轉數據結構——集合（Set）與映射（Map）

exce ger 圖片 his remove @override 算法 ima 時間 1.. 集合的應用集合可以用來去重集合可以用於進行客戶的統計集合可以用於文本詞匯量的統計 2.. 集合的實現定義集合的接口 Set<

第三十二篇玩轉數據結構——AVL樹

ces this true 函數 port ide cep row ger 1.. 平衡二叉樹平衡二叉樹要求，對於任意一個節點，左子樹和右子樹的高度差不能超過1。平衡二叉樹的高度和節點數量之間的關系也是O(logn) 為二叉樹標註節點高度並計算平

玩轉數據結構從入門到進階

環境復雜度分析但是鏈表實現循環隊列課程什麽解決計算機科學第1章歡迎學習《玩轉數據結構》歡迎大家學習《玩轉數據結構》課程。在這個課程中，我們將從底層實現諸多數據結構，從簡單，到復雜，並且探索他們的應用。在這一章，我們將來看一看數據結構的具體作用，學習數據結

【程式碼】用Python玩轉微信，echarts餅圖，WordCloud雲圖，自動回覆訊息，好友地區熱圖

參考用Python玩轉微信（一），做了一些修改 import re import os import time import itchat from echarts import Echart, Legend, Pie import wordcloud from wordcloud im

10分鐘教你用Python玩轉微信之抓取好友個性簽名製作詞雲

01 前言+展示各位小夥伴我又來啦。今天帶大家玩點好玩的東西，用Python抓取我們的微信好友個性簽名，然後製作詞雲。怎樣，有趣吧~好了，下面開始幹活。我知道你們還是想先看看效果的。後臺登入：詞雲： 02 環境準備 Python版本：3.6.0系統平臺：W

10分鐘教你用Python玩轉微信之好友性別比例統計分析

01 前言+效果展示想必，微信對於大家來說，是再熟悉不過的了。那麼，大家想不想探索一下微信上的各種奧祕呢？今天，我們一起來簡單分析一下微信上的好友性別比例吧~廢話不多說，開始幹活。結果如下： 02 環境準備 Python版本：3.6.0系統平臺：Windows 10

用python玩轉微信小遊戲大小猜猜看

用python玩轉微信小遊戲大小猜猜看遊戲模式在微信小程式裡搜尋“大小猜猜看”，即可找到該遊戲。遊戲的目標比拼計算能力，找出誰大誰小，一共有40題，全部答對即挑戰成功。一開始答題時間充足，數字也比較簡單，後面就需要特別快的計算速度。專案地址本專案地址

用Python玩轉資料——20180928學習筆記

import pandas as pd import numpy as np djidf = pd.read_csv(r'C:\Users\USER\Desktop\^DJI.csv') pd.set_option('display.max_columns',5

wxpy：用 Python 玩轉微信就是這麼簡單

前言 wxpy 在 itchat 的基礎上，通過大量介面優化提升了模組的易用性，並進行豐富的功能擴充套件。用來幹啥一些常見的場景控制路由器、智慧家居等具有開放介面的玩意兒執行指令碼時自動把日誌傳送到你的微信加群主為好友，自動拉進群中跨號或跨群轉發訊

筆記 Data Processing Using Python 1（用Python玩轉資料第一章）

輸入語句： price=raw_input("String"); 109; price; #值為109，型別為‘str’ 109; price; #值為109，型別為‘str’ 註釋問題：#註釋; \ 續行符；''',(不用加續行符；縮排問題：增加縮排表示語句的開始；

用Python玩轉時序資料

時間序列是日常生活中最常見的資料型別之一。股票價格、銷售資訊、氣候資料、能源使用，甚至個人身高體重都是可以用來定期收集的資料樣本。幾乎每個資料科學家在工作中都會遇到時間序列，能夠有效地處理這些資料是資料科學領域之中的一項非常重要的技能。本文簡要介紹瞭如何從零開始使用Python中的時間序列。

《用Python玩轉數據》項目—線性回歸分析入門之波士頓房價預測（二）

相關推薦