機器學習吳恩達-線性回歸筆記（1）

阿新 • • 發佈：2019-04-06

設置裏的更新 sha names value p s itl inf

回歸問題的思想（1）先找到損失函數，（2）求損失函數最小化後的參數

假設我們的數據是（m,n）有m行數據，n個特征（feature）

則我們預測函數為 :

寫成向量形式為（xo=1）:

技術分享圖片

ps:因為存在截距項，這裏的X矩陣是n+1維的

定義代價函數CostFunction:

求 minJ(θ)

技術分享圖片

得到目標函數後，我們目標是想要代價函數盡可能小，利用凸優化知識，對J(θ)求偏導並帶入梯度下降公式中：

梯度下降請參考：https://www.cnblogs.com/pinard/p/5970503.html

技術分享圖片

向量式：i=(1,2，...n)

技術分享圖片

α是步長，決定更新快慢(過大可能會導致溢出)

到這裏就能求出所需要的參數的更新公式。

下面的例子是單變量的例子，用的隨機梯度，因為可以直接畫圖出，比較直觀。

 1 import pandas as pd
 2 import numpy as np
 3 def CostFunction(x,y,theta):
 4     med_var=np.power((x*theta)-y,2)
 5     return np.sum(med_var)/(2*len(x))
 6 
 7 def Grandent(x,y,theta,alphl,maxcircle):
 8     m = x.shape[0]
 9     print 
(‘m=‘,m)
10     print(‘theta shape‘,theta.shape)
11     temp = np.matrix(np.zeros(theta.shape))
12     print(‘temp shape‘,temp.shape)
13     cost = np.zeros(maxcircle)  # 初始化一個ndarray，包含每次叠代的cost
14     for k in range(maxcircle):
15         # print(theta)
16         temp=theta-(alphl/m)*(x.T)*(x*theta-y)
 
17         cost[k]=CostFunction(x,y,theta)
18         theta=temp
19     return theta,cost
20 
21 
22 data=pd.read_csv(‘ex1data1.txt‘,names=[‘feature‘,‘price‘])   #(97, 2)
23 data.insert(0,‘x0‘,1)
24 X_dataframe=data.drop([‘price‘],axis=1)
25 y_dataframe=data.price
26 X=np.matrix(X_dataframe.values)  #專程矩陣格式
27 y=np.matrix(y_dataframe.values)
28 y=y.T
29 m,n=X_dataframe.shape
30 theta=np.zeros((n,1))
31 alphl=0.01  #開始設置為0.1,會一直報溢出，導致梯度下降方法不收斂
32 maxcircle=1000
33 
34 theta_fin,cost=Grandent(X,y,theta,alphl,maxcircle)
35 
36 import matplotlib.pyplot as plt
37 
38 fig,ax = plt.subplots()
39 
40 ax.plot(np.arange(maxcircle), cost, ‘red‘)  # np.arange()返回等差數組
41 ax.set_xlabel(‘Iterations‘)
42 ax.set_ylabel(‘Cost‘)
43 ax.set_title(‘Cost vs. num_Iterations‘)
44 
45 #np.linspace()在指定的間隔內返回均勻間隔的數字
46 x = np.linspace(data.feature.min(), data.feature.max(), 100) # 橫坐標
47 f = theta_fin[0,0] + (theta_fin[1,0] * x)  # 縱坐標
48 fig,ax = plt.subplots()
49 ax.plot(x, f, ‘r‘, label=‘Prediction‘)
50 ax.scatter(data[‘feature‘], data.price, label=‘Traning Data‘)
51 ax.legend(loc=2)  # 2表示在左上角
52 ax.set_xlabel(‘feature‘)
53 ax.set_ylabel(‘price‘)
54 ax.set_title(‘Predicted Profit vs. Population Size‘)
55 plt.show()

技術分享圖片

下面是叠代1000，2000次的結果

技術分享圖片

機器學習吳恩達-線性回歸筆記（1）

設置裏的更新 sha names value p s itl inf 回歸問題的思想（1）先找到損失函數，（2）求損失函數最小化後的參數假設我們的數據是（m,n）有m行數據，n個特征（feature）則我們預測函數為 : 寫成向量形式為（xo=1）:

【機器學習吳恩達】CS229課程筆記notes1翻譯-Part I線性迴歸

CS229課程筆記吳恩達監督學習讓我們開始談論一些監督學習的例子。假定我們有一個數據集，給出俄勒岡州波特蘭地區47套房屋的居住面積和價格：我們可以在圖上畫出這些點：根據這些資料，我們怎麼學習預測波特蘭地區其他房屋的價格，看

【機器學習吳恩達】CS229課程筆記notes4翻譯-Part VI學習理論

CS229課程筆記吳恩達 Part VI 學習理論 1 偏差/方差權衡當我們談論線性迴歸，我們討論它是否擬合一個簡單的模型，比如線性模型“y=θ0+θ1x”，或者更復雜的模型，比如多項式模型“y=θ0+θ1x+θ2x2+θ3x3+θ

【機器學習吳恩達】CS229課程筆記notes1翻譯-Part II分類和logistic迴歸

CS229 課程筆記吳恩達 Part II 分類和logistic迴歸我們現在談論分類問題。分類問題與迴歸問題類似，區別是在分類問題中，我們現在想要預測的y值只取少量的離散值。現在，我們聚焦於二值分類問題，y只取兩個值，0和1。（我們在這裡說的大多數

機器學習---吳恩達---Week1（機器學習概述與單變量線性回歸方程分析）

行數操作相加 vision 強化學習 machine 其余 tro ram 機器學習概述 Machine Learning: Grew out of work in AI & New capability for computers Examples:

機器學習-吳恩達-正規方程多變量回歸公式

com .cn bsp 學習 http ria family mage -1 矩陣的跡 A為nXn的矩陣機器學習-吳恩達-正規方程多變量回歸公式

機器學習--吳恩達（線性迴歸，梯度下降，正規方程法）

本節課是對監督學習的講解，ng以自動駕駛為例，告訴我們汽車對方向的預測是連續值，故而是迴歸問題。什麼是迴歸問題？（regression）確定兩種或兩種以上變數相互依賴的定量關係的一種統計分析方法迴歸與分類問題的不同迴歸與分類都屬於預測問題，而回歸預測的結果是連續的值

機器學習(3)——多變量線性回歸

function 包括 ade each pop text times value 應該【一、多變量線性回歸模型】多變量線性回歸是指輸入為多維特征的情況。比如：在上圖中可看出房子的價格price由四個變量(size、number of be

Coursera 深度學習吳恩達 deep learning.ai 筆記整理（3-2）——機器學習策略

新的 bsp 誤差 spa 歸納空間 font 處理整理一、誤差分析定義：有時我們希望算法能夠勝任人類能做的任務，但是當算法還沒達到人類所預期的性能時，人工檢查算法錯誤會讓你知道接下來做什麽，這也就是誤差分析檢查，發現會把夠狗當恒，是否需要做一個項目專門處理狗

機器學習之路: python 線性回歸LinearRegression, 隨機參數回歸SGDRegressor 預測波士頓房價

誤差差異 ces color square 均方誤差 rep score 處理 python3學習使用api 線性回歸，和隨機參數回歸 git: https://github.com/linyi0604/MachineLearning 1 from skle

coursera-斯坦福-機器學習-吳恩達-筆記week2

線性歸一化有變擬合分享選擇多元線性回歸縮放轉置 1 多元線性回歸 1.1 假設函數多元線性回歸是指有多個特征特征變量的情況。此時我們修改假設函數hθ(x)=θ0+θ1?x為hθ(x)=θ0+θ1x1+θ2x2+?+θnxn。設x0=1，x為特征向量，θ為參

coursera-斯坦福-機器學習-吳恩達-筆記week3

發生足夠 bfgs clas 方法技術影響限制分享 1 邏輯回歸 1. classification 分類 eg：垃圾郵件分類、交易是否是欺詐、腫瘤類別。分類的結果是離散值。 2. sigmoid函數　　使用線性方法來判斷分類問題，會出現上圖中的問題，需要

掌握Spark機器學習庫-07.6-線性回歸實現房價預測

linear 線性 ack transform regress build count random () 數據集 house.csv 數據概覽代碼 package org.apache.spark.examples.examplesforml import org

機器學習 | 吳恩達機器學習第四周程式設計作業(Python版本)

實驗指導書下載密碼:u8dl 本篇部落格主要講解，吳恩達機器學習第四周的程式設計作業，作業內容主要是對手寫數字進行識別，是一個十分類問題，要求使用兩種不同的方法實現：一是用之前講過的邏輯迴歸實現手寫數字識別，二是用本週講的神經網路實現手寫數字

機器學習 | 吳恩達機器學習第四周學習筆記

課程視訊連結第四周課件下載密碼:kx0q 上一篇部落格主要介紹了第三週的課程的內容，主要講解分類問題，引入了邏輯迴歸模型來解決分類問題，並詳細的介紹了邏輯迴歸模型的細節，包括假設函式，代價函式，優化求解方法包括之前學習的梯度下降法和更高

機器學習 | 吳恩達機器學習第二週程式設計作業(Python版）

實驗指導書下載密碼:hso0 本篇部落格主要講解，吳恩達機器學習第二週的程式設計作業，作業內容主要是實現單元/多元線性迴歸演算法。實驗的原始版本是用Matlab實現的，本篇部落格主要用Python來實現。目錄 1.實驗包含的檔案 2.單元

機器學習 | 吳恩達機器學習第三週程式設計作業(Python版)

實驗指導書下載密碼:fja4 本篇部落格主要講解，吳恩達機器學習第三週的程式設計作業，作業內容主要是利用邏輯迴歸演算法(正則化)進行二分類。實驗的原始版本是用Matlab實現的，本篇部落格主要用Python來實現。目錄 1.實驗包含的檔案 2.使用邏

機器學習 | 吳恩達機器學習第六週學習筆記

課程視訊連結第六週PPT 下載密碼:zgkq 本週主要講解了如何設計機器學習系統和如何改進機器學習系統，包括一些模型選擇的方法，模型效能的評價指標，模型改進的方法等。目錄一、應用機器學習建議 1.決定下一步做什麼 2.評估假設函式 3.模型選擇和訓練、驗

機器學習 | 吳恩達機器學習第八週學習筆記

課程視訊連結第八週PPT 下載密碼:qedd 上週主要講解了支援向量機SVM的原理包括優化目標、大間隔以及核函式等SVM核心內容，以及SVM的使用。本週主要講解經典的無監督聚類演算法k-means，包括k-means的優化目標，原理以及一些引數設定細節；和降維演算法PCA的原理，

機器學習 | 吳恩達機器學習第八週程式設計作業(Python版）

實驗指導書下載密碼:higl 本篇部落格主要講解，吳恩達機器學習第八週的程式設計作業，主要包含KMeans實驗和PCA實驗兩部分。原始實驗使用Matlab實現，本篇部落格提供Python版本。目錄 1.實驗包含的檔案 2.KMeans實驗 3.K-me

機器學習吳恩達-線性回歸筆記（1）

相關推薦