機器學習 | 吳恩達機器學習第二週程式設計作業(Python版）

阿新 • • 發佈：2018-11-12

實驗指導書下載密碼:hso0

本篇部落格主要講解，吳恩達機器學習第二週的程式設計作業，作業內容主要是實現單元/多元線性迴歸演算法。實驗的原始版本是用Matlab實現的，本篇部落格主要用Python來實現。

1.實驗包含的檔案

檔名稱	含義
ex1.py	單元線性迴歸的主程式
ex1_multi.py	多元線性迴歸主程式
ex1data1.txt	單變數線性迴歸資料集
ex1data2.txt	多變數線性迴歸資料集
plotData.py	視覺化資料集程式
computeCost.py	計算線性迴歸的代價函式程式
gradientDescent.py	梯度下降法程式
featureNormalize.py	特徵縮放程式
normalEqn.py	正規方程求解線性迴歸程式

實驗任務完成紅色部分程式的關鍵程式碼。

2.單元線性迴歸

任務：預測快餐車的收益，輸入變數只有一個特徵是城市的人口，輸出變數是快餐車在該城市的收益。
開啟單元線性迴歸主程式ex1.py

'''第1部分 視覺化訓練集'''
print('Plotting Data...')
data = np.loadtxt('ex1data1.txt', delimiter=',', usecols=(0, 1))#載入txt格式的資料集 每一行以","分隔
X = data[:, 0]   #輸入變數 第一列
y = data[:, 1]   #輸出變數 第二列
m = y.size     #樣本數

plt.ion()
plt.figure(0)
plot_data(X, y)  #視覺化資料集

編寫視覺化程式plotData.py

def plot_data(x, y):
   
    plt.scatter(x,y,marker='o',s=50,cmap='Blues',alpha=0.3)  #繪製散點圖
    plt.xlabel('population')  #設定x軸標題
    plt.ylabel('profits')   #設定y軸標題 

    plt.show()

視覺化效果

使用梯度下降法求解單元線性迴歸


'''第2部分 梯度下降法'''
print('Running Gradient Descent...')

X = np.c_[np.ones(m), X]  # 輸入特徵矩陣 前面增加一列1 方便矩陣運算
theta = np.zeros(2)  # 初始化兩個引數為0  


iterations = 1500  #設定梯度下降迭代次數
alpha = 0.01      #設定學習率

# 計算最開始的代價函式值  並與期望值比較 驗證程式正確性
print('Initial cost : ' + str(compute_cost(X, y, theta)) + ' (This value should be about 32.07)')

#使用梯度下降法求解線性迴歸 返回最優引數 以及每一步迭代後的代價函式值
theta, J_history = gradient_descent(X, y, theta, alpha, iterations)

print('Theta found by gradient descent: ' + str(theta.reshape(2)))

# 在資料集上繪製出擬合的直線
plt.figure(0)
line1, = plt.plot(X[:, 1], np.dot(X, theta), label='Linear Regression')
plt.legend(handles=[line1])

input('Program paused. Press ENTER to continue')

# 用訓練好的引數 預測人口為3.5*1000時 收益為多少  並與期望值比較 驗證程式正確性
predict1 = np.dot(np.array([1, 3.5]), theta)
print('For population = 35,000, we predict a profit of {:0.3f} (This value should be about 4519.77)'.format(predict1*10000))
# 用訓練好的引數 預測人口為7*1000時 收益為多少  並與期望值比較 驗證程式正確性
predict2 = np.dot(np.array([1, 7]), theta)
print('For population = 70,000, we predict a profit of {:0.3f} (This value should be about 45342.45)'.format(predict2*10000))

編寫計算線性迴歸代價函式的程式computeCost.py


def h(X,theta):  #線性迴歸假設函式
    return X.dot(theta)
    
def compute_cost(X, y, theta):
    
    m = y.size #樣本數
    cost = 0   #代價函式值
    myh=h(X,theta)  #得到假設函式值  (m,)
    
    cost=(myh-y).dot(myh-y)/(2*m)  #計算代價函式值

    return cost

與期望值進行比較，說明我們編寫的計算代價函式的程式碼是正確的。

編寫梯度下降法程式gradientDescent.py


def gradient_descent(X, y, theta, alpha, num_iters):
    
    m = y.size #樣本數 
    J_history = np.zeros(num_iters)  #每一次迭代都有一個代價函式值

    for i in range(0, num_iters):   #num_iters次迭代優化
        theta=theta-(alpha/m)*(h(X,theta)-y).dot(X)
        J_history[i] = compute_cost(X, y, theta) #用每一次迭代產生的引數 來計算代價函式值

    return theta, J_history

梯度下降法求解的最優引數值：

利用訓練好的引數進行預測，與期望值進行比較，驗證我們的程式是正確的：

在資料集上視覺化擬合的直線：

根據不同的引數取值，視覺化代價函式

'''第3部分 視覺化代價函式'''
print('Visualizing J(theta0, theta1) ...')

theta0_vals = np.linspace(-10, 10, 100)  #引數1的取值
theta1_vals = np.linspace(-1, 4, 100)    #引數2的取值

xs, ys = np.meshgrid(theta0_vals, theta1_vals)   #生成網格
J_vals = np.zeros(xs.shape)


for i in range(0, theta0_vals.size):
    for j in range(0, theta1_vals.size):
        t = np.array([theta0_vals[i], theta1_vals[j]])
        J_vals[i][j] = compute_cost(X, y, t)    #計算每個網格點的代價函式值

J_vals = np.transpose(J_vals)

fig1 = plt.figure(1)      #繪製3d圖形
ax = fig1.gca(projection='3d')
ax.plot_surface(xs, ys, J_vals)
plt.xlabel(r'$\theta_0$')
plt.ylabel(r'$\theta_1$')

#繪製等高線圖 相當於3d圖形的投影
plt.figure(2)
lvls = np.logspace(-2, 3, 20)
plt.contour(xs, ys, J_vals, levels=lvls, norm=LogNorm())
plt.plot(theta[0], theta[1], c='r', marker="x")

視覺化效果：

3.單元線性迴歸完整專案程式碼

下載連結下載密碼:d8dd

4.多元線性迴歸

任務：預測房價，輸入變數有兩個特徵，一是房子的面積，二是房子臥室的數量；輸出變數是房子的價格。
開啟多元線性迴歸主程式ex1_multi.py


'''第1部分 特徵縮放'''
print('Loading Data...')
data = np.loadtxt('ex1data2.txt', delimiter=',', dtype=np.int64)#載入txt格式資料集 每一行以','分隔
X = data[:, 0:2]   #得到輸入變數矩陣  每個輸入變數有兩個輸入特徵 
y = data[:, 2]   #輸出變數 
m = y.size  #樣本數

# 列印前10個訓練樣本
print('First 10 examples from the dataset: ')
for i in range(0, 10):
    print('x = {}, y = {}'.format(X[i], y[i]))

input('Program paused. Press ENTER to continue')

# 特徵縮放  不同特徵的取值範圍差異很大  通過特徵縮放 使其在一個相近的範圍內
print('Normalizing Features ...')

X, mu, sigma = feature_normalize(X)
X = np.c_[np.ones(m), X]  # 得到縮放後的特徵矩陣  前面加一列1  方便矩陣運算

編寫特徵縮放程式featureNormalize.py

def feature_normalize(X):
   
    n = X.shape[1]  # shape[1]返回特徵矩陣列數 即特徵數
    X_norm = X     #初始化特徵縮放後的特徵矩陣
    mu = np.zeros(n)  #初始化每一列特徵的均值
    sigma = np.zeros(n)  #初始化每一列特徵的標準差

    mu=np.mean(X,axis=0) #對每一列求均值
    sigma=np.std(axis=0) #對每一列求標準差
    X_norm=(X_norm-mu)/sig #廣播 每一列減去該列的均值/該列的標準差

    return X_norm, mu, sigma

使用梯度下降法求解最優引數並進行預測,繪製代價函式隨迭代次數的變化曲線


'''第2部分 梯度下降法'''



print('Running gradient descent ...')


alpha = 0.03  #學習率
num_iters = 400 #迭代次數


theta = np.zeros(3)#初始化引數
theta, J_history = gradient_descent_multi(X, y, theta, alpha, num_iters) #梯度下降求解引數

# 繪製代價函式值隨迭代次數的變化曲線
plt.figure()
plt.plot(np.arange(J_history.size), J_history)
plt.xlabel('Number of iterations')
plt.ylabel('Cost J')

# 列印求解的最優的引數
print('Theta computed from gradient descent : \n{}'.format(theta))

# 預測面積是1650 臥室數是3 的房子的價格

x1=np.array([1650,3])

x1=(x1-mu)/sigma  #對預測樣例進行特徵縮放
x1=np.r_[1,x1]  #前面增加一個1
price = h(x1,theta)  #帶入假設函式 求解預測值


# ==========================================================

print('Predicted price of a 1650 sq-ft, 3 br house (using gradient descent) : {:0.3f}'.format(price))

編寫計算線性迴歸代價函式的程式computeCost.py


def h(X,theta):  #線性迴歸假設函式
    return X.dot(theta)
    
def compute_cost(X, y, theta):
    
    m = y.size #樣本數
    cost = 0   #代價函式值
    myh=h(X,theta)  #得到假設函式值  (m,)
    
    cost=(myh-y).dot(myh-y)/(2*m)  #計算代價函式值

    return cost

編寫梯度下降法程式gradientDescent.py


def gradient_descent_multi(X, y, theta, alpha, num_iters):
    
    m = y.size #樣本數 
    J_history = np.zeros(num_iters)  #每一次迭代都有一個代價函式值

    for i in range(0, num_iters):   #num_iters次迭代優化
        theta=theta-(alpha/m)*(h(X,theta)-y).dot(X)
        J_history[i] = compute_cost(X, y, theta) #用每一次迭代產生的引數 來計算代價函式值

    return theta, J_history

梯度下降法求解的最優引數，樣例的預測價格以及代價函式隨迭代次數的變化曲線

利用正規方程法求解多元線性迴歸，並預測樣例的房價

'''第3部分 正規方程法求解多元線性迴歸'''
#正規方程法不用進行特徵縮放

print('Solving with normal equations ...')



# Load data
data = np.loadtxt('ex1data2.txt', delimiter=',', dtype=np.int64)
X = data[:, 0:2]
y = data[:, 2]
m = y.size

# 增加一列特徵1
X = np.c_[np.ones(m), X]

theta = normal_eqn(X, y) #正規方程法

# 列印求解的最優引數
print('Theta computed from the normal equations : \n{}'.format(theta))

# 預測面積是1650 臥室數是3 的房子的價格

x2=np.array([1,1650,3])
price = h(x2,theta) #帶入假設函式 求解預測值


# ==========================================================

print('Predicted price of a 1650 sq-ft, 3 br house (using normal equations) : {:0.3f}'.format(price))

編寫正規方程法程式 normalEqn.py

def normal_eqn(X, y):
    theta = np.zeros((X.shape[1], 1))

    theta=inv(X.T.dot(X)).dot(X.T).dot(y)


    return theta

正規方程法求解的最優引數，和預測樣例的房價

可以看到兩種方法預測的房價差不多。

5.多元線性迴歸完整專案程式碼

下載連結下載密碼:cz04

機器學習 | 吳恩達機器學習第二週程式設計作業(Python版）

實驗指導書下載密碼:hso0 本篇部落格主要講解，吳恩達機器學習第二週的程式設計作業，作業內容主要是實現單元/多元線性迴歸演算法。實驗的原始版本是用Matlab實現的，本篇部落格主要用Python來實現。目錄 1.實驗包含的檔案 2.單元

深度學習-吳恩達第一課第二週課程作業

這周作業是，給出一張圖片，判斷這張圖是不是貓。這是一個二分類問題，結果是非0即1的，使用邏輯迴歸（Logic Regression），可以說，瞭解這個迴歸方法，有些python基礎，會使用jupyter notebook就可以嘗試著碼一遍程式碼，走完整個學習流程，能進一步

機器學習 | 吳恩達機器學習第八週程式設計作業(Python版）

實驗指導書下載密碼:higl 本篇部落格主要講解，吳恩達機器學習第八週的程式設計作業，主要包含KMeans實驗和PCA實驗兩部分。原始實驗使用Matlab實現，本篇部落格提供Python版本。目錄 1.實驗包含的檔案 2.KMeans實驗 3.K-me

機器學習 | 吳恩達機器學習第六週程式設計作業(Python版）

實驗指導書下載密碼:4t4y 本篇部落格主要講解，吳恩達機器學習第六週的程式設計作業，作業內容主要是實現一個正則化的線性迴歸演算法，涉及本週講的模型選擇問題，繪製學習曲線判斷高偏差/高方差問題。原始實驗使用Matlab實現，本篇部落格提供Python版本。目錄 1.實驗包

Coursera 深度學習吳恩達 deep learning.ai 筆記整理（3-2）——機器學習策略

新的 bsp 誤差 spa 歸納空間 font 處理整理一、誤差分析定義：有時我們希望算法能夠勝任人類能做的任務，但是當算法還沒達到人類所預期的性能時，人工檢查算法錯誤會讓你知道接下來做什麽，這也就是誤差分析檢查，發現會把夠狗當恒，是否需要做一個項目專門處理狗

機器學習 | 吳恩達機器學習第四周程式設計作業(Python版本)

實驗指導書下載密碼:u8dl 本篇部落格主要講解，吳恩達機器學習第四周的程式設計作業，作業內容主要是對手寫數字進行識別，是一個十分類問題，要求使用兩種不同的方法實現：一是用之前講過的邏輯迴歸實現手寫數字識別，二是用本週講的神經網路實現手寫數字

機器學習 | 吳恩達機器學習第四周學習筆記

課程視訊連結第四周課件下載密碼:kx0q 上一篇部落格主要介紹了第三週的課程的內容，主要講解分類問題，引入了邏輯迴歸模型來解決分類問題，並詳細的介紹了邏輯迴歸模型的細節，包括假設函式，代價函式，優化求解方法包括之前學習的梯度下降法和更高

機器學習 | 吳恩達機器學習第三週程式設計作業(Python版)

實驗指導書下載密碼:fja4 本篇部落格主要講解，吳恩達機器學習第三週的程式設計作業，作業內容主要是利用邏輯迴歸演算法(正則化)進行二分類。實驗的原始版本是用Matlab實現的，本篇部落格主要用Python來實現。目錄 1.實驗包含的檔案 2.使用邏

機器學習 | 吳恩達機器學習第六週學習筆記

課程視訊連結第六週PPT 下載密碼:zgkq 本週主要講解了如何設計機器學習系統和如何改進機器學習系統，包括一些模型選擇的方法，模型效能的評價指標，模型改進的方法等。目錄一、應用機器學習建議 1.決定下一步做什麼 2.評估假設函式 3.模型選擇和訓練、驗

機器學習 | 吳恩達機器學習第八週學習筆記

課程視訊連結第八週PPT 下載密碼:qedd 上週主要講解了支援向量機SVM的原理包括優化目標、大間隔以及核函式等SVM核心內容，以及SVM的使用。本週主要講解經典的無監督聚類演算法k-means，包括k-means的優化目標，原理以及一些引數設定細節；和降維演算法PCA的原理，

機器學習 | 吳恩達機器學習第七週程式設計作業(Python版)

實驗指導書下載密碼:a15g 本篇部落格主要講解，吳恩達機器學習第七週的程式設計作業，包含兩個實驗，一是線性svm和帶有高斯核函式的svm的基本使用；二是利用svm進行垃圾郵件分類。原始實驗使用Matlab實現，本篇部落格提供Python版本。目錄 1.

機器學習 | 吳恩達機器學習第七週學習筆記

課程視訊連結第七週PPT 下載密碼:tmss 上週主要講解了如何設計機器學習系統和如何改進機器學習系統，包括一些模型選擇的方法，模型效能的評價指標，模型改進的方法等。本週主要講解支援向量機SVM的原理包括優化目標、大間隔以及核函式等SVM核心內容，以及SVM的使用。 &nbs

機器學習 | 吳恩達機器學習第三週學習筆記

第三週PPT彙總下載連結:https://pan.baidu.com/s/101uY5KV_2i3Ey516DYma_A 密碼:8o4e 上一篇部落格主要介紹了第二週的課程的內容，包括多變數線性迴歸，使用梯度下降法求解多變數線性迴歸的實用技巧，特徵縮放與模型特徵選擇並

Coursera 深度學習 deep learning.ai 吳恩達神經網路和深度學習第一課第二週程式設計作業 Python Basics with Numpy

Python Basics with Numpy (optional assignment) Welcome to your first assignment. This exercise gives you a brief introduction to P

深度學習-吳恩達第一課第四周課程作業

在前面兩節課的基礎上，這次作業是訓練一個N層神經網路，來判斷一張圖片是否有貓，實現過程其實和第三週很相似，因為層數不確定，所以在向前傳播和反向傳播的時候會用到for迴圈，程式碼相對而言反而更精簡了。貼出的程式碼可能和老師給的模板不一樣，我沒有看到老師的原版課程作業，也是在網上

《深度學習——Andrew Ng》第一課第二週程式設計作業

最近在網易雲課堂學習《深度學習》微專業，將課後的程式設計作業記錄下來。 Logistic Regression with a Neural Network mindset Welcome to your first (required) pr

吳恩達機器學習（第二章）----線性迴歸

線性迴歸要做的主要包含代價函式和梯度下降。一、基本解釋線性迴歸的過程其實就是我們在選擇好某個型別的函式之後去不斷的擬合現有的資料，那麼什麼情況下我們這個函式是最符合，最貼近我們這些資料的呢？就是在代價函式的值最小的時候。二、代價函式假設要擬合的函式是h(x)=

吳恩達機器學習課程筆記——第二週

1. 多變數線性迴歸(Linear Regression with Multiple Variables) 也稱為多元線性迴歸，一元就是一個變數，多元就是多個變數，在這裡也可以叫做多個特徵 1.1 多維特徵(Multiple Features) 之前，

吳恩達機器學習筆記--第二週-3.解析法計算引數

week2-3.Computing Parameters Analytically一、Normal Equation正規方程（normal equation）用求（偏）導的方法求最值（若是多元變數函式，需要對每個變數求偏導，然後令他們都為0）：使用正規方程求J函式最值：構建設

斯坦福大學(吳恩達) 機器學習課後習題詳解第二週程式設計題線性迴歸

習題可以去這個地址下載 http://download.csdn.net/download/wwangfabei1989/102654071. warmUpExercise.m的實現如下： function A = warmUpExercise()%WARMUPEXERCI

機器學習 | 吳恩達機器學習第二週程式設計作業(Python版）

1.實驗包含的檔案

2.單元線性迴歸

3.單元線性迴歸完整專案程式碼

4.多元線性迴歸

5.多元線性迴歸完整專案程式碼

相關推薦