7.【基礎】波士頓房價預測--LinearRegression

阿新 • • 發佈：2019-02-20

本文所有實現程式碼均來自《Python機器學習及實戰》

#-*- coding:UTF-8 -*-

#第一步：讀取波士頓房價資料
from sklearn.datasets import load_boston
boston = load_boston()
print boston.DESCR
#從輸出結果來看，該資料共有506條波士頓房價的資料，每條資料包括對指定房屋的13項數值型特徵和目標房價
#此外，該資料中沒有缺失的屬性/特徵值，更加方便了後續的分析

#第二步：波士頓房價資料分割
from sklearn.cross_validation import train_test_split
import 
 numpy as np
X_train,X_test,y_train,y_test = train_test_split(boston.data,boston.target,test_size=0.25,random_state=33)
#分析迴歸目標值的差異
print 'The max target value is ',np.max(boston.target)
print 'The min target value is ',np.min(boston.target)
print 'The average target value is ',np.mean(boston.target)

#第三步：訓練資料和測試資料標準化處理 

from sklearn.preprocessing import StandardScaler
#分別初始化對特徵值和目標值的標準化器
ss_X = StandardScaler()
ss_y = StandardScaler()
#訓練資料都是數值型，所以要標準化處理
X_train = ss_X.fit_transform(X_train)
X_test = ss_X.transform(X_test)
#目標資料（房價預測值）也是數值型，所以也要標準化處理
#說明一下：fit_transform與transform都要求操作2D資料，而此時的y_train與y_test都是1D的，因此需要呼叫reshape(-1,1)，例如：[1,2,3]變成[[1],[2],[3]] 

y_train = ss_y.fit_transform(y_train.reshape(-1,1))
y_test = ss_y.transform(y_test.reshape(-1,1))

#第四步：使用線性迴歸模型LinearRegression和SGDRegressor分別對美國房價進行預測
#不要搞混了，這裡用的是LinearRegression而不是線性分類的LogisticRegression
from sklearn.linear_model import LinearRegression
lr = LinearRegression()
lr.fit(X_train,y_train)
lr_y_predict = lr.predict(X_test)
from sklearn.linear_model import SGDRegressor
sgdr = SGDRegressor()
sgdr.fit(X_train,y_train)
sgdr_y_predict = sgdr.predict(X_test)

#第五步：效能測評
#主要是判斷預測值與真實值之間的差距，比較直觀的評價指標有
#平均絕對值誤差MAE(mean absolute error)
#均方誤差MSE(mean squared error)
#R-squared評價函式
#使用LinearRegression模型自帶的評估模組，並輸出評估結果
print 'the value of default measurement of LR：',lr.score(X_test,y_test)
from sklearn.metrics import r2_score,mean_squared_error,mean_absolute_error
print 'the value of R-squared of LR is',r2_score(y_test,lr_y_predict)
#可以使用標準化器中的inverse_transform函式還原轉換前的真實值
print 'the MSE of LR is',mean_squared_error(ss_y.inverse_transform(y_test),ss_y.inverse_transform(lr_y_predict))
print 'the MAE of LR is',mean_absolute_error(ss_y.inverse_transform(y_test),ss_y.inverse_transform(lr_y_predict))
#使用SGDRegressor自帶的評估模組，並輸出評估結果
print 'the value of default measurement of SGDR：',sgdr.score(X_test,y_test)
from sklearn.metrics import r2_score,mean_squared_error,mean_absolute_error
print 'the value of R-squared of SGDR is',r2_score(y_test,sgdr_y_predict)
print 'the MSE of SGDR is',mean_squared_error(ss_y.inverse_transform(y_test),ss_y.inverse_transform(sgdr_y_predict))
print 'the MAE of SGDR is',mean_absolute_error(ss_y.inverse_transform(y_test),ss_y.inverse_transform(sgdr_y_predict))

#總結：
#從輸出結果來看，迴歸模型自帶的評估結果與r2_score的值是一樣的，推薦使用第一種方式
#SGDRegressor在效能上表現略遜於LinearRegression，前者是隨機梯度下降的方式估計引數，後者是精確解析引數
#在資料量十分龐大（10W+）的時候，推薦使用SGDRegressor

7.【基礎】波士頓房價預測--LinearRegression

本文所有實現程式碼均來自《Python機器學習及實戰》 #-*- coding:UTF-8 -*- #第一步：讀取波士頓房價資料 from sklearn.datasets import load_boston boston = load_boston(

10.【基礎】波士頓房價預測--DecisionTreeRegressor

本文所有實現程式碼均來自《Python機器學習及實戰》 #-*- coding:utf-8 -*- #說明：前面的資料讀取、分割、標準化處理還是採用上一講的程式碼，只是模型的訓練換成了迴歸樹模型 #第一步：讀取波士頓房價資料 from sklearn.

【udacity】機器學習-波士頓房價預測

import numpy as np import pandas as pd from Udacity.model_check.boston_house_price import visuals as vs # Supplementary code from sklearn.model_

【python資料分析】波士頓房價分析小例子

一、匯入模組 %matplotlib inline #將生成的圖片嵌入網頁中 import matplotlib.pyplot as plt from sklearn import datasets from sklearn.feature_sele

【基礎】C#異常處理的總結

ember -s 有效理解 dac 十進制 reference bsp msil 一、異常處理的理解？異常處理是指程序在運行過程中，發生錯誤會導致程序退出，這種錯誤，就叫做異常。因此處理這種錯誤，就稱為異常處理。二、異常處理如何操作？ C# 異常處

【基礎】計算機的存儲單元--01與字的轉化

選址概念 tro 基礎 word cpu 可選處理控制器什麽是位(bit)、字節(Byte)、字、KB、MB 位(bit)："位"是電子計算機中最小的數據單位，類似於（兩，公斤，克）的概念。每一位的狀態只能是0或1,比如：11010100是一個8位二進制數。

【基礎】ORACLE中substr的用法

itl .cn 字符串 ref art from 基礎 htm bst ORACLE中substr函數的簡單用法 substr(字符串,截取開始位置,截取長度) //返回截取的字 substr(‘Hello World‘,0,1) //返回結果為 ‘H‘ *從字符串第一

[ML]keras波士頓房價預測模型

ets close 方法 valid seq same layer n) 預測 from keras.datasets import boston_housing from keras.models import Sequential from keras.layers

【基礎】Attribute的妙用

.net main 屬性。常用現狀 void 例子 exc 作者一、何為Attribute 下面是微軟官方對Attribute的解釋：公共語言運行時允許你添加類似關鍵字的描述聲明，叫做Attributes，它對程序中的元素進行標註，如類型、字段、方法和屬性等

python自動安裝mysql5.7【轉】

local chown .cn 主從 execute lower 裏的 eve 數量 #!/usr/bin/env python import os import sys import re base_dir = ‘/opt/software/my

【基礎】循環數【模擬】

int under 每一個宋體 can port toc log flag 1096: 【基礎】循環數【模擬】時間限制: 1 Sec 內存限制: 128 MB提交: 426 解決: 283[提交][狀態][討論版] 題目描述描述 n 位的一個整數是循環數（cyc

【基礎】循環以及循環控制語句

初始返回自增區別嵌套for循環循環結構使用方法後置共同點 while： /* 演示while和do...while的使用方法及區別 while (表達式){ 代碼塊 } do { 代碼塊 } while(表達式)； while與

【基礎】函數的聲明&返回值

com 高效率 ima tar 函數類 pac inf mage ase 以加減乘除運算為例 /* 函數的一般形式：類型標示符函數名(形式參數,形式參數...){ 函數體 } 類型表示符為該函數返回值的類型不返回任何值的函數，返回值類型可以用voi

【基礎】函數的參數傳遞

輸出結果技術 blog span sin image using 問題實現 #include <iostream>using namespace std; int main(){ int x,y; cin >> x >&

UOJ#7. 【NOI2014】購票 | 線段樹凸包優化DP

科學 uil 影響現在 problem long llb noi cpp 題目鏈接 UOJ #7 題解首先這一定是DP！可以寫出： \[f[i] = \min_{ancestor\ j} \{f[j] + (d[j] - d[i]) * p[i] + q[i]\}\]

【基礎】在css中繪制三角形及相關應用

3.1 三角形分享圖片繪制提示框穩定核心包括邊框顏色簡言本文簡要闡述了用CSS邊框的方法在頁面上繪制三角形，包括幾種典型的三角形繪制，還介紹了幾個簡單的應用場景。利用邊框繪制三角形方法只是眾多方案中的一種，大家根據項目實際，選用最適宜項目的方案。 1 基

正則表達式【基礎】

因此 tab 出現字符字母 app bbc 正則表達 abc /abc/ 雙斜桿表示裏面是正則表達式在awk中使用方法：awk ‘/a.c/{print $0}‘ data.txt .和\ awk ‘/a.c/{print $0}‘ data.txt 使用a.c

【基礎】結構體重載，用 char*作為std::map中的key

重載 http 註意 urn .net 參考 article 添加無法結構體重載 C++中，結構體是無法進行==，>，<，>=，<=，!=這些操作的，這也帶來了很多不方便的地方，尤其是在使用STL容器的時候，如果我們可以往語句中傳入結構體，一些

Python開發【第二十一篇】：Web框架之Django【基礎】

name line 控制 creat js等 nec serve pan xiaohua 一、 Django簡介 1.web框架簡介具體介紹Django之前，必須先介紹WEB框架等概念。 web框架：別人已經設定好的一個web網站模板，你學習它的規則，然後“填空”或“修

【基礎】1019 逆序數

一個一個比，資料太大就會超時。程式碼如下: #include<iostream> using namespace std; int a[50005]; int main(){ int n; long long ans=0; cin>>n; for(int i=

7.【基礎】波士頓房價預測--LinearRegression

相關推薦