scikit-learn 線性迴歸擬合正弦函式，預測房價

阿新 • • 發佈：2018-12-09

隨書程式碼，閱讀筆記。

線性迴歸擬合正弦函式


%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np

n_dots = 200

X = np.linspace(-2 * np.pi, 2 * np.pi, n_dots)
Y = np.sin(X) + 0.2 * np.random.rand(n_dots) - 0.1
X = X.reshape(-1, 1)
Y = Y.reshape(-1, 1);


from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.pipeline import Pipeline

def polynomial_model(degree=1):
    polynomial_features = PolynomialFeatures(degree=degree,
                                             include_bias=False)
    linear_regression = LinearRegression(normalize=True)
    pipeline = Pipeline([("polynomial_features", polynomial_features),
                         ("linear_regression", linear_regression)])
    return pipeline


from sklearn.metrics import mean_squared_error

degrees = [2, 3, 5, 10]
results = []
for d in degrees:
    model = polynomial_model(degree=d)
    model.fit(X, Y)
    train_score = model.score(X, Y)
    mse = mean_squared_error(Y, model.predict(X))
    results.append({"model": model, "degree": d, "score": train_score, "mse": mse})
for r in results:
    print("degree: {}; train score: {}; mean squared error: {}".format(r["degree"], r["score"], r["mse"]))

:
from matplotlib.figure import SubplotParams

plt.figure(figsize=(12, 6), dpi=200, subplotpars=SubplotParams(hspace=0.3))
for i, r in enumerate(results):
    fig = plt.subplot(2, 2, i+1)
    plt.xlim(-8, 8)
    plt.title("LinearRegression degree={}".format(r["degree"]))
    plt.scatter(X, Y, s=5, c='b', alpha=0.5)
    plt.plot(X, r["model"].predict(X), 'r-')

預測房價

%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np

from sklearn.datasets import load_boston

boston = load_boston()
X = boston.data
y = boston.target
X.shape

boston.feature_names


from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=3)

import time
from sklearn.linear_model import LinearRegression

model = LinearRegression()

#model = LinearRegression(normalize=True) #歸一化，能加快演算法收斂速度，優化演算法訓練效率，無法提升演算法準確性

start = time.clock()
model.fit(X_train, y_train)

train_score = model.score(X_train, y_train)
cv_score = model.score(X_test, y_test)
print('elaspe: {0:.6f}; train_score: {1:0.6f}; cv_score: {2:.6f}'.format(time.clock()-start, train_score, cv_score))

from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.pipeline import Pipeline

def polynomial_model(degree=1):
    polynomial_features = PolynomialFeatures(degree=degree,
                                             include_bias=False)
    linear_regression = LinearRegression(normalize=True)
    pipeline = Pipeline([("polynomial_features", polynomial_features),
                         ("linear_regression", linear_regression)])
    return pipeline

model = polynomial_model(degree=2)

start = time.clock()
model.fit(X_train, y_train)

train_score = model.score(X_train, y_train)
cv_score = model.score(X_test, y_test)
print('elaspe: {0:.6f}; train_score: {1:0.6f}; cv_score: {2:.6f}'.format(time.clock()-start, train_score, cv_score))

#elaspe: 0.016412; train_score: 0.930547; cv_score: 0.860465

#畫出學習曲線
from common.utils import plot_learning_curve
from sklearn.model_selection import ShuffleSplit

cv = ShuffleSplit(n_splits=10, test_size=0.2, random_state=0)
plt.figure(figsize=(18, 4), dpi=200)
title = 'Learning Curves (degree={0})'
degrees = [1, 2, 3]

start = time.clock()
plt.figure(figsize=(18, 4), dpi=200)
for i in range(len(degrees)):
    plt.subplot(1, 3, i + 1)
    plot_learning_curve(plt, polynomial_model(degrees[i]), title.format(degrees[i]), X, y, ylim=(0.01, 1.01), cv=cv)

print('elaspe: {0:.6f}'.format(time.clock()-start))

多項式的階數對訓練模型效能影響很大，階數低，容易欠擬合，階數高，容易過擬合。

scikit-learn 線性迴歸擬合正弦函式，預測房價

隨書程式碼，閱讀筆記。線性迴歸擬合正弦函式 %matplotlib inline import matplotlib.pyplot as plt import numpy as np n_dots = 200 X = np.linspace(-2 * np.pi

scikit-learn 線性迴歸模型的score函式，返回值是決定係數R^2

http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html#sklearn.linear_model.LinearRegression http://scikit-le

scikit-learn : 線性迴歸，多元迴歸，多項式迴歸

匹薩的直徑與價格的資料 %matplotlib inline import matplotlib.pyplot as plt def runplt(): plt.figure() plt.title(u'diameter-cost

scikit-learn : 線性迴歸

# 線性迴歸背景從線性迴歸(Linear regression)開始學習迴歸分析，線性迴歸是最早的也是最基本的模型——把資料擬合成一條直線。 — # 資料集使用scikit-learn裡的資料集boston,boston資料集很適合用來演示線性

keras線性迴歸擬合直線

# -*- coding: utf-8 -*- """ Created on Sat Aug 26 18:25:28 2017 線性迴歸擬合直線 @author: Han """ from keras.

用 sklearn 線性迴歸擬合房價與房屋尺寸關係

線性迴歸：  線性迴歸(Linear Regression)是利用數理統計中迴歸分析，來確定兩種或兩種以上變數間相互依賴的定量關係的一種統計分析方法。  線性迴歸利用稱為線性迴歸方程的最小平方函式對一個或多個自變數和因變數之間關係進行建模。這種函式

skiti-learn線性迴歸演算法庫

線性迴歸的目的是要得到輸出向量Y和輸入特徵X之間的線性關係，求出線性迴歸係數θ,也就是 Y=Xθ。其中Y的維度為mx1，X的維度為mxn，而θ的維度為nx1 LinearRegression 最常見的普通線性迴歸，損失函式如下： J(θ)=1/2 (Xθ−Y)T (Xθ−Y)

scikit-learn 邏輯迴歸實現乳腺癌檢測

隨書程式碼，閱讀筆記載入資料 %matplotlib inline import matplotlib.pyplot as plt import numpy as np # 載入資料 from sklearn.datasets import load_breast_ca

[work] 擬合目標函式後驗分佈的調參利器：貝葉斯優化

如何優化機器學習的超引數一直是一個難題，我們在模型訓練中經常需要花費大量的精力來調節超引數而獲得更好的效能。因此，貝葉斯優化利用先驗知識逼近未知目標函式的後驗分佈從而調節超引數就變得十分重要了。本文簡單介紹了貝葉斯優化的基本思想和概念，更詳細的推導可檢視文末提供的論文。

二元二次擬合 matlab函式

二元二次擬合自變數有2個，因變數一個，可以使用的有nlinfit和regress，線性時用regress，非線性時用nlinfit。由於是二元二次模型，2個函式都可以用。以regress為例，假設因變數存在y向量中，自變數存在x1、x2向量中。因為要使用二元二次模型，首先

機器學習（二）分類器及迴歸擬合

在機器學習中，分類器作用是在標記好類別的訓練資料基礎上判斷一個新的觀察樣本所屬的類別。分類器依據學習的方式可以分為非監督學習和監督學習。非監督學習顧名思義指的是給予分類器學習的樣本但沒有相對應類別標籤，主要是尋找未標記資料中的隱藏結構。，監督學習通過標記的訓練資

手寫：邏輯迴歸擬合二維資料（tensorflow）

tensorflow開發的基本步驟 1、定義tensorflow輸入節點【3種方法】 2、定義學習引數的變數【2種方法】 3、定義運算 4、選擇優化函式，優化目標 5、初始化所有變數 6、迭代更新引數到最優解 7、測試模型 8、使用模型下面就挑前幾個比較重要

使用神經網路分分彩原始碼下載擬合argmax函式

最近比分分彩原始碼下載QQ2952777280【話仙原始碼論壇】 hxforum.com 較閒，聽說神經網路可以擬合任意函式，因此嘗試使用神經網路擬合argmax函式。我使用的是pytorch，就是堆疊多層感知機來擬合一個argmax函式。為了防止不收斂，我的輸入是一個 20維的向量，要求輸出的

最詳細的基於R語言的Logistic Regression（Logistic迴歸）原始碼，包括擬合優度，Recall，Precision的計算

這篇日誌也確實是有感而發，我對R不熟悉，但實驗需要，所以簡單學了一下。發現無論是網上無數的教程，還是書本上的示例，在講Logistic Regression的時候就是給一個簡單的函式及輸出結果說明。從來都沒有講清楚幾件事情： 1. 怎樣用訓練資料訓練模型，然後在測試資料

scikit-learn 邏輯迴歸例子詳解

import numpy as np import matplotlib.pyplot as plt from sklearn import linear_model, datasets # import some data to play with iris = datasets.load_iris()

sklearn實戰：使用knn進行迴歸擬合

%matplotlib inline import matplotlib.pyplot as plt import numpy as np # 生成訓練樣本 n_dots = 40 X = 5 * np.random.rand(n_dots, 1) y

深度學習之TensorFlow 第三章基本開發步驟--以邏輯迴歸擬合二維資料為例

深度學習有四個步驟：準備資料搭建模型迭代訓練使用模型 import tensorflow as tf import numpy as np #陣列 import matplotlib.pyplot as plt # matplotlib.pyplot

Scikit-Learn與迴歸樹

迴歸演算法原理 CART(Classification and Regression Tree)演算法是目前決策樹演算法中最為成熟的一類演算法，應用範圍也比較廣泛。它既可以用於分類。西方預測理論一般都是基於迴歸的，CART是一種通過決策樹方法實現

橢圓擬合的函式式子以及繪製外接矩形

1 voidcvBoxPoints(CvBox2Dbox,CvPoint2D32fpt[4]) 2 { 3 doubleangle=box.angle*CV_PI/180. 4 floata=(float)cos(angle)*0.5f; 5 floatb=(float)sin(angle)*0.5

matlab與BP神經網路擬合非線性函式

背景介紹在實際工程應用中會遇到一些複雜的非線性系統，這些系統方程複雜，難以用數學方法建模。在這種情況下，可以使用BP神經網路表達這些非線性系統。該方法把位置系統看成是一個黑箱，首先用系統輸入輸出資料訓練BP神經網路，使網路能夠表達該未知函式，然後用訓練好的BP神經網路預測系統

scikit-learn 線性迴歸擬合正弦函式，預測房價

相關推薦