keras探索：regression-波士頓房價預測例項（小樣本K折驗證）

阿新 • • 發佈：2018-12-13

open source: deep learning with python (keras)

open code: https://github.com/fchollet/deep-learning-with-python-notebooks/blob/master/3.7-predicting-house-prices.ipynb

from keras.datasets import boston_housing
from keras import models
from keras import layers

import numpy as np
import matplotlib.pyplot as plt


def build_model():
    model = models.Sequential()
    model.add(layers.Dense(64, 
                           activation = 'relu', 
                           input_shape = (train_data.shape[1],)))
    model.add(layers.Dense(64,
                           activation = 'relu'))
    model.add(layers.Dense(1)) # activation function will limit putput range
    model.compile(optimizer = 'rmsprop',
                  loss = 'mse',
                  metrics=['mae'])
    return model
    

(train_data, train_targets), (test_data, test_targets) = \
    boston_housing.load_data()

mean = train_data.mean(axis=0)
std  = train_data.std(axis=0)
train_data -= mean
train_data /= std

test_data -= mean
test_data /= std


#++++++++++++++++K-fold validation
k = 4
num_val_samples = len(train_data) // k
num_epochs = 500
all_mae_histories = []

for i in range(k):
    print('Processing fold #', i)
    val_data = train_data[i*num_val_samples : (i+1)*num_val_samples]
    val_targets = train_targets[i*num_val_samples : (i+1)*num_val_samples]
    
    partial_train_data = np.concatenate( 
                         [train_data[: i*num_val_samples],
                         train_data[(i+1)*num_val_samples :]],
                         axis = 0)
    partial_train_targets = np.concatenate(
                         [train_targets[: i*num_val_samples],
                         train_targets[(i+1)*num_val_samples :]],
                         axis = 0)
    model = build_model()
    history = model.fit(partial_train_data,
                        partial_train_targets,
                        validation_data = (val_data, val_targets),
                        epochs = num_epochs,
                        batch_size = 1,
                        verbose = 1)
    mae_history = history.history['val_mean_absolute_error']
    all_mae_histories.append(mae_history)
    average_mae_history = [ np.mean([x[i] \
                                    for x in all_mae_histories]) \
                                    for i in range(num_epochs)]

#+++++++++++++++++ triaining final model
model = build_model()
model.fit(train_data, 
          train_targets,
          epochs = 100,
          batch_size = 16,
          verbose = 1)
test_mae, _ = model.evaluate(test_data, test_targets)


#+++++++++++++++++ matplotlib
plt.plot(range(1, len(average_mae_history)+1), average_mae_history)
plt.xlabel('Epochs')
plt.ylabel('Validation Mae')
plt.show()

總結-關於小樣本K-折驗證：

為了調節神經網路（比如說神經網路的訓練輪數）的同時對網路進行評估，我們需要將資料集劃分為訓練集和測試集。如果樣本的資料量很少（小樣本問題），驗證集會更小，因此驗證分數可能會有很大的波動，這完全取決於如何劃分訓練集和驗證集。這就是小樣本中常見的，驗證集的劃分方式可能會存在很大的方差，這種情況下很難對模型進行有效可靠地評估。

最佳做法是採用K-折驗證的方式，其原理圖如下所示。

如果訓練資料集相對較小，則增大k值

增大k值，在每次迭代過程中將會有更多的資料用於模型訓練，能夠得到最小偏差，同時演算法時間延長。且訓練塊間高度相似，導致評價結果方差較高。

如果訓練集相對較大，則減小k值

減小k值，降低模型在不同的資料塊上進行重複擬合的效能評估的計算成本，在平均效能的基礎上獲得模型的準確評估。

keras探索：regression-波士頓房價預測例項（小樣本K折驗證）

open source: deep learning with python (keras) open code: https://github.com/fchollet/deep-learning-with-python-notebooks/blob/master/3.7-predic

吳恩達機器學習課程筆記02——處理房價預測問題（梯度下降演算法詳解）

建議記住的實用符號符號含義 m 樣本數目 x 輸入變數 y 輸出變數/目標變數

[ML]keras波士頓房價預測模型

ets close 方法 valid seq same layer n) 預測 from keras.datasets import boston_housing from keras.models import Sequential from keras.layers

kreas搭建神經網路預測波士頓房價（手寫K折交叉驗證）

1、程式說明所有注意事項均寫入註釋 from keras.datasets import boston_housing import numpy as np from keras import models from keras import layers from keras.o

Tensorflow之多元線性迴歸問題（以波士頓房價預測為例）

一、根據波士頓房價資訊進行預測，多元線性迴歸+特徵資料歸一化 #讀取資料 %matplotlib notebook import tensorflow as tf import matplotlib.pyplot as plt import numpy as np

《用Python玩轉資料》專案—線性迴歸分析入門之波士頓房價預測（二）

接上一部分，此篇將用tensorflow建立神經網路，對波士頓房價資料進行簡單建模預測。二、使用tensorflow擬合boston房價datasets 1、資料處理依然利用sklearn來分訓練集和測試集。 2、使用一層隱藏層的簡單網路，試下來用當前這組超引數收斂較快，準確率也可以。 3、啟用函式

《用Python玩轉數據》項目—線性回歸分析入門之波士頓房價預測（二）

store mil ima 超參數 eval app lac on() break 接上一部分，此篇將用tensorflow建立神經網絡，對波士頓房價數據進行簡單建模預測。二、使用tensorflow擬合boston房價datasets 1、數據處理依然利用sklearn

線性迴歸之波士頓房價預測

from sklearn.datasets import load_boston import numpy as np import matplotlib.pyplot as plt def feature_scalling(X): mean = X.mean(axis=0) s

keras探索：nlp-基於內容的推薦系統(單標籤，不涉及使用者畫像)

open resource ：deep learning with python (keras) open code: https://github.com/fchollet/deep-learning-with-python-notebooks/blob/master/3.6-clas

keras探索：nlp-電影評論分類

open resource ：deep learning with python (keras) opencode ：https://github.com/fchollet/deep-learning-with-python-notebooks/blob/master/3.5-class

期末作業——波士頓房價預測及中文文字分詞

一、boston房價預測 1. 讀取資料集 from sklearn.datasets import load_boston boston = load_boston() boston.keys() print(boston.DESCR) boston.data.shape imp

10.【基礎】波士頓房價預測--DecisionTreeRegressor

本文所有實現程式碼均來自《Python機器學習及實戰》 #-*- coding:utf-8 -*- #說明：前面的資料讀取、分割、標準化處理還是採用上一講的程式碼，只是模型的訓練換成了迴歸樹模型 #第一步：讀取波士頓房價資料 from sklearn.

【udacity】機器學習-波士頓房價預測

import numpy as np import pandas as pd from Udacity.model_check.boston_house_price import visuals as vs # Supplementary code from sklearn.model_

python線性迴歸的小例子--波士頓房價預測

今天學習了簡單的線性迴歸，用波士頓房價的例子測試了一下 import pandas as pd import numpy as np from sklearn import datasets import matplotlib.pyplot as plt from skle

7.【基礎】波士頓房價預測--LinearRegression

本文所有實現程式碼均來自《Python機器學習及實戰》 #-*- coding:UTF-8 -*- #第一步：讀取波士頓房價資料 from sklearn.datasets import load_boston boston = load_boston(

波士頓房價預測 - 最簡單入門機器學習 - Jupyter

機器學習入門專案分享 - 波士頓房價預測該分享源於Udacity機器學習進階中的一個mini作業專案，用於入門非常合適，刨除了繁瑣的部分，保留了最關鍵、基本的步驟，能夠對機器學習基本流程有一個最清晰的認識；專案描述利用馬薩諸塞州波士頓郊區的房屋資訊資料訓練和測試一個模型，並對模型的效能和預測能力進行測試

基於sklearn的波士頓房價預測_線性迴歸學習筆記

> 　以下內容是我在學習https://blog.csdn.net/mingxiaod/article/details/85938251 教程時遇到不懂的問題自己查詢並理解的筆記，由於sklearn版本更迭改動了原作者的程式碼，如有理解偏差歡迎指正。　1. np.linspace　　　　　　np.l

Python進階：函數語言程式設計例項（附程式碼）

上篇文章“幾個小例子告訴你, 一行Python程式碼能幹哪些事 -- 知乎專欄”中用到了一些列表解析、生成器、map、filter、lambda、zip等表達形式，這就涉及到了Python中關於函數語言程式設計（functional programming）的語法、函式等

線性迴歸---波士頓房價資料集（改）

這裡我們用到了特徵篩，為什麼要進行特徵進行選擇？在一個數據集中，我們需要找出對因變數影響顯著的變數，對於顯著性較低的我們進行剔除，留下顯著性高的特徵把它們加入模型，從而使我們的模型複雜度更低，更加的簡潔，準確。這篇文章使用反向淘汰的方法來進行此項工作

使用tensorflow：LSTM神經網路預測股票（三）

原始資料處理有朋友在qq群裡分享了原始資料處理的想法，例如調整origin_data_row引數、新增一些大盤的資料作為新的特徵等。所以這一篇我將原始資料以及原始資料的處理方法寫下來，為方便大家驗證、探

keras探索：regression-波士頓房價預測例項（小樣本K折驗證）

相關推薦