Stanford coursera Andrew Ng 機器學習課程程式設計作業（Exercise 1）Python3.x

阿新 • • 發佈：2019-02-14

Exercise 1：Linear Regression---實現一個線性迴歸

在本次練習中，需要實現一個單變數的線性迴歸。假設有一組歷史資料<城市人口，開店利潤>，現需要預測在哪個城市中開店利潤比較好？

歷史資料如下：第一列表示城市人口數，單位為萬人；第二列表示利潤，單位為10,000$

    5.5277    9.1302
    8.5186   13.6620
    7.0032   11.8540
    .....
    ......

程式碼

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
    #
    #單變數線性迴歸
    #
path = 'ex1data1.txt'
data = pd.read_csv(path,header=None,names=['population','profit'])
data.head()    #檢視前5行資料（預設） ，data.head(3)則是前三行

data.describe()     #得到data資料的整體概括
print(data.describe())

#新增一列
data.insert(0,'ones',1)   # 就是在第一列（0） 新增名字為 ones 的一列資料，他的數值都是 1      #偏置數值x0 = 1 ！！！
#展示資料
data.plot(kind = 'scatter' , x = 'population' , y = 'profit' )    #  設定畫板型別,figsize是畫板大小
plt.show()

def computeCost(x,y,theta):   #初始化單變數線性迴歸
    inner = np.power(((x*theta.T) - y),2)     #power(x,2)  , 就是將x數組裡面的元素都2次方
    return np.sum(inner) / (2*len(x))
#初始化變數
cols = data.shape[1]
x = data.iloc[:,0:cols - 1]    #x是所有的行 ， 去掉最後一列
y = data.iloc[:,cols - 1:cols]   # y就是最後一列資料


#初始化資料
x = np.matrix(x.values)   #轉化成 矩陣形式
y = np.matrix(y)
theta = np.matrix(np.array([0,0])) #theta就是一個（1,2）矩陣
costFunction = computeCost(x,y,theta)
print(costFunction)


#
#        批量梯度下降
#
def gradientDescent(x,y,theta,alpha,iters): #alpha = 學習速率  ，iters = 迭代次數
    temp = np.matrix(np.zeros(theta.shape))
    print(temp)
    parameters = int(theta.ravel().shape[1])  # ravel就是合併矩陣
    print(parameters)
    cost = np.zeros(iters)

    for i in range(iters):
        error = (x * theta.T) - y
        for j in range(parameters):
            term = np.multiply(error,x[:,j])      #multiply 對應元素乘法
            temp[0,j] = theta[0,j] - ((alpha / len(x)) * np.sum(term))
        theta = temp
        cost[i] = computeCost(x,y,theta)

    return theta,cost

#初始化資料
alpha = 0.01
iters = 1000
gradientDescent(x,y,theta,alpha,iters)
g,cost = gradientDescent(x,y,theta,alpha,iters)
print(cost)
print(computeCost(x,y,g))

#繪製擬合曲線
x = np.linspace(data.population.min(),data.population.max(),100)  #llinspace(start,stop,num) num就是生成的樣本數
f = g[0,0] + (g[0,1] * x)   #g[0,0] 代表theta0 , g[0,1] 代表theta1
fig,ax = plt.subplots()
ax.plot(x,f,'r',label = 'prediction')
ax.scatter(data.population,data.profit,label = 'training data')
ax.legend(loc=2)
ax.set_xlabel('population')
ax.set_ylabel('profit')
plt.show()

Stanford coursera Andrew Ng 機器學習課程程式設計作業（Exercise 1）Python3.x

Exercise 1：Linear Regression---實現一個線性迴歸在本次練習中，需要實現一個單變數的線性迴歸。假設有一組歷史資料<城市人口，開店利潤>，現需要預測在哪個城市中開店利潤比較好？歷史資料如下：第一列表示城市人口數，單位為萬人；第二

【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 10—Advice for applying machine learning

Lecture 10—Advice for applying machine learning 10.1 如何除錯一個機器學習演算法？有多種方案： 1、獲得更多訓練資料；2、嘗試更少特徵；3、嘗試更多特徵；4、嘗試新增多項式特徵；5、減小 λ；6、增大 λ 為了避免一個方案一個方

coursera 斯坦福 Andrew Ng 機器學習_程式設計作業

一. 第二週程式設計作業: Linear Regression 1.computeCost.m 公式：程式碼： %計算成本J tmp = (X * theta - y) .^ 2; J = 1 / (2 * m) * sum(tmp); 2.gradientD

【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 11—Machine Learning System Design

Lecture 11—Machine Learning System Design 11.1 垃圾郵件分類本章中用一個實際例子：垃圾郵件Spam的分類來描述機器學習系統設計方法。首先來看兩封郵件，左邊是一封垃圾郵件Spam，右邊是一封非垃圾郵件Non-Spam：垃圾郵件有很多features。如果我

【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 12—Support Vector Machines 支援向量機

Lecture 12 支援向量機 Support Vector Machines 12.1 優化目標 Optimization Objective 支援向量機(Support Vector Machine) 是一個更加強大的演算法，廣泛應用於工業界和學術界。與邏輯迴歸和神經網路相比, SVM在學習複雜的非

【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 14—Dimensionality Reduction 降維

Lecture 14 Dimensionality Reduction 降維 14.1 降維的動機一:資料壓縮 Data Compression 現在討論第二種無監督學習問題：降維。降維的一方面作用是資料壓縮，允許我們使用較少的記憶體或磁碟空間，也加快演算法速度。例子：假設我們用兩個特徵描述一個物

【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 15—Anomaly Detection異常檢測

Lecture 15 Anomaly Detection 異常檢測 15.1 異常檢測問題的動機 Problem Motivation 異常檢測(Anomaly detection)問題是機器學習演算法的一個常見應用。這種演算法雖然主要用於無監督學習問題，但從某些角度看，它又類似於一些監督學習問題。舉例：

【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 16—Recommender Systems 推薦系統

Lecture 16 Recommender Systems 推薦系統 16.1 問題形式化 Problem Formulation 在機器學習領域，對於一些問題存在一些演算法，能試圖自動地替你學習到一組優良的特徵。通過推薦系統(recommender systems)，將領略一小部分特徵學習的思想。

【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 17—Large Scale Machine Learning 大規模機器學習

Lecture17 Large Scale Machine Learning大規模機器學習 17.1 大型資料集的學習 Learning With Large Datasets 如果有一個低方差的模型，通常通過增加資料集的規模，可以獲得更好的結果。但是如果資料集特別大，則首先應該檢查這麼大規模是否真

【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 18—Photo OCR 應用例項:圖片文字識別

Lecture 18—Photo OCR 應用例項:圖片文字識別 18.1 問題描述和流程圖 Problem Description and Pipeline 影象文字識別需要如下步驟: 1.文字偵測(Text detection)——將圖片上的文字與其他環境物件分離開來2.字元切分(Character

【原】Coursera—Andrew Ng機器學習—彙總（課程筆記、測驗習題答案、程式設計作業原始碼）

一、Coursera 斯坦福機器學習課程，Andrew Ng Coursera連線不上，修改hosts檔案機器學習工具Octave安裝（Win10環境）課程地址和軟體下載

Andrew Ng機器學習課程筆記（四）之神經網絡

【原】Coursera—Andrew Ng機器學習—Week 8 習題—聚類和降維

【1】無監督演算法【2】聚類【3】代價函式【4】【5】K的選擇【6】降維 Answer：本來是 n 維，降維之後變成 k 維（k ≤ n）【7】【8】 Answer：斜率-1 【9】 Answer： x 是一個向

【原】Coursera—Andrew Ng機器學習—Week 10 習題—大規模機器學習

【1】大規模資料【2】隨機梯度下降【3】小批量梯度下降【4】隨機梯度下降的收斂 Answer：BD A 錯誤。學習率太小，演算法容易很慢 B 正確。學習率小，效果更好 C 錯誤。應該是確定閾值吧 D 正確。曲線不下降，說明學習率選的太大【5】線上學習

斯坦福大學(Andrew Ng)機器學習課程講義

Lecture notes 1 (ps)(pdf) Supervised Learning, Discriminative Algorithms Lecture notes 2 (ps)(pdf) Generative Algorithms Lecture notes 3 (ps)(pd

Andrew Ng機器學習課程筆記（十三）之無監督學習之EM演算法

Preface Jensen’s Inequality（Jensen不等式） Expectation-Maximization Algorithm（EM演算法） Jensen’s Inequality 對於凸函式令f(x)f(x)為

Andrew Ng機器學習課程之學習筆記---牛頓方法

牛頓方法本次課程大綱： 1、牛頓方法：對Logistic模型進行擬合 2、指數分佈族 3、廣義線性模型（GLM）：聯絡Logistic迴歸和最小二乘模型複習： Logistic迴歸：分類演算法假設給定x以為引數的y=1和y=0的概率：求對數似然性：對其求偏導數，應用梯度上升

Andrew Ng機器學習課程筆記（十二）之無監督學習之K-means聚類演算法

Preface Unsupervised Learning（無監督學習） K-means聚類演算法 Unsupervised Learning 我們以前介紹的所有演算法都是基於有類別標籤的資料集，當我們對於沒有標籤的資料進行分類時，以前的方

Andrew NG機器學習課程筆記（十）

特徵選擇嚴格上來說也是模型選擇的一種。這裡不去辨析他們的關係，重點說明問題。假設我們想對維度為n的樣本進行迴歸，然後，n可能大多以至於遠遠大於訓練樣例數。但是我們感覺很多特徵對於結果是無用的，想剔除n中的無用特徵。n個特徵就有2^n種情況。如果我們去列舉這些情況，然後利用交叉驗證去選，太麻煩了。因此需要一些啟

Andrew Ng 機器學習課程的Python實現

完全用Python完成吳恩達的機器學習課程是怎樣一種體驗？本文作者表示：完全可以！而且你不需要成

Stanford coursera Andrew Ng 機器學習課程程式設計作業（Exercise 1）Python3.x

程式碼

相關推薦