西瓜書《機器學習》課後答案——Chapter3_3.3

阿新 • • 發佈：2018-12-25

3.3 程式設計實現對率迴歸，並給出西瓜資料集3.0alpha（89頁表4.9）上的結果。

"""
Author: Victoria
Created on: 2017.9.14 11:00
"""
import matplotlib.pyplot as plt
import numpy as np
import xlrd

def sigmoid(x):
    """
    Sigmoid function.
    Input:
        x:np.array
    Return:
        y: the same shape with x
    """    
    y =1.0 
 / ( 1 + np.exp(-x))
    return y

def newton(X, y):
    """
    Input:
        X: np.array with shape [N, 3]. Input. 
        y: np.array with shape [N, 1]. Label.
    Return:
        beta: np.array with shape [1, 3]. Optimal params with newton method
    """
    N = X.shape[0]
    #initialization
    beta = np.ones((1 
, 3)) 
    #shape [N, 1]
    z = X.dot(beta.T)
    #log-likehood
    old_l = 0
    new_l = np.sum(-y*z + np.log( 1+np.exp(z) ) )
    iters = 0
    while( np.abs(old_l-new_l) > 1e-5):
        #shape [N, 1]
        p1 = np.exp(z) / (1 + np.exp(z))
        #shape [N, N]
        p = np.diag((p1 * (1-p1)).reshape(N))
        #shape [1, 3] 

        first_order = -np.sum(X * (y - p1), 0, keepdims=True)
        #shape [3, 3]
        second_order = X.T .dot(p).dot(X)

        #update
        beta -= first_order.dot(np.linalg.inv(second_order))
        z = X.dot(beta.T)
        old_l = new_l
        new_l = np.sum(-y*z + np.log( 1+np.exp(z) ) )

        iters += 1
    print "iters: ", iters
    print new_l 
    return beta

def gradDescent(X, y):
    """
    Input:
        X: np.array with shape [N, 3]. Input. 
        y: np.array with shape [N, 1]. Label.
    Return:
        beta: np.array with shape [1, 3]. Optimal params with gradient descent method
    """

    N = X.shape[0]
    lr = 0.05
    #initialization
    beta = np.ones((1, 3)) * 0.1
    #shape [N, 1]
    z = X.dot(beta.T)

    for i in range(150):
        #shape [N, 1]
        p1 = np.exp(z) / (1 + np.exp(z))
        #shape [N, N]
        p = np.diag((p1 * (1-p1)).reshape(N))
        #shape [1, 3]
        first_order = -np.sum(X * (y - p1), 0, keepdims=True)

        #update
        beta -= first_order * lr
        z = X.dot(beta.T)

    l = np.sum(-y*z + np.log( 1+np.exp(z) ) )
    print l 
    return beta

if __name__=="__main__":

    #read data from xlsx file
    workbook = xlrd.open_workbook("3.0alpha.xlsx")
    sheet = workbook.sheet_by_name("Sheet1")
    X1 = np.array(sheet.row_values(0))
    X2 = np.array(sheet.row_values(1))
    #this is the extension of x
    X3 = np.array(sheet.row_values(2)) 
    y = np.array(sheet.row_values(3))
    X = np.vstack([X1, X2, X3]).T
    y = y.reshape(-1, 1)

    #plot training data
    for i in range(X1.shape[0]):
        if y[i, 0] == 0:           
            plt.plot(X1[i], X2[i], 'r+')

        else:
            plt.plot(X1[i], X2[i], 'bo')

    #get optimal params beta with newton method 
    beta = newton(X, y)
    newton_left = -( beta[0, 0]*0.1 + beta[0, 2] ) / beta[0, 1]
    newton_right = -( beta[0, 0]*0.9 + beta[0, 2] ) / beta[0, 1]
    plt.plot([0.1, 0.9], [newton_left, newton_right], 'g-')

    #get optimal params beta with gradient descent method
    beta = gradDescent(X, y)
    grad_descent_left = -( beta[0, 0]*0.1 + beta[0, 2] ) / beta[0, 1]
    grad_descent_right = -( beta[0, 0]*0.9 + beta[0, 2] ) / beta[0, 1]
    plt.plot([0.1, 0.9], [grad_descent_left, grad_descent_right], 'y-')

    plt.xlabel('density')
    plt.ylabel('sugar rate')
    plt.title("LR")
    plt.show()

這裡寫圖片描述
綠線是Newton結果，黃線是梯度下降法的結果。需要注意的是，梯度下降法的學習率取值對結果的影響比較大，如果取值不好的話，那麼對應的黃線可能會特別偏上或者偏下。

西瓜書《機器學習》課後答案——Chapter3_3.3

3.3 程式設計實現對率迴歸，並給出西瓜資料集3.0alpha（89頁表4.9）上的結果。 """ Author: Victoria Created on: 2017.9.14 11:00 """ import matplotlib.pyplot as p

西瓜書機器學習總結（一）

1.基本概念 1.資料集，特徵屬性，屬性值，訓練集，樣本，標記，獨立同分布的假設balabala….簡單易懂 2.歸納學習與歸納偏好：廣義從樣例學習，狹義是學習概念。西瓜模型的學習可以理解為從假設空間中搜索匹配，剔除不符合，最終會有多個模型，這個

西瓜書《機器學習》課後答案——Chapter3_3.5

程式設計實現線性判別分析，並給出西瓜資料集3.0alpha上的結果。 """ Author: Victoria Created on: 2017.9.15 11:45 """ import xlr

西瓜書《機器學習》課後答案——Chapter6_6.3

6.3 選擇兩個UCI資料集，分別用線性核和高斯核訓練一個SVM，並與BP神經網路和C4.5決策樹進行實驗比較。解答：（1）準備libsvm的訓練資料與測試資料從UCI網站上選擇了Iris資料集，這個資料集總共分為3類，每類50個樣本，每個例項有四

python實現西瓜書《機器學習》習題4.3資訊增益決策樹

首先這篇的格式可能會亂，markdown裝上以後，有時候是用csdn原來的編輯器，有時候就變成了markdown編輯器，蒙。更蒙的是，大牛的程式碼太飄逸了，有點看不懂，慣例先來原地址：https://blog.csdn.net/Snoopy_Yuan/article/details/689

《機器學習西瓜書》學習筆記——第七章_貝葉斯分類器_樸素貝葉斯分類器

樸素：特徵條件獨立；貝葉斯：基於貝葉斯定理。樸素貝葉斯是經典的機器學習演算法之一，也基於概率論的分類演算法，屬於監督學習的生成模型。樸素貝葉斯原理簡單，也很容易實現，多用於文字分類，比如垃圾郵件過濾。 1.演算法思想——基於概率的預測貝葉斯決策論是概率框架下

機器學習（西瓜書）學習筆記（一）---------模型評估與選擇

1、經驗誤差與過擬合經驗誤差：一般的，我們把學習器的實際預測輸出與樣本的真實輸出之間的差異稱為“誤差”，學習器在訓練集上的誤差稱為“訓練誤差”或“經驗誤差”，在新樣本上的誤差稱為“泛化誤差”；通常我們想要的一個學習器是能夠通過訓練樣本的學習後能較準確的

機器學習（西瓜書）學習筆記（四）---------神經網路

1. 神經元模型神經網路/人工神經網路：由具有適應性的簡單單元組成的廣泛並行互連的網路。神經網路學習：機器學習和神經網路兩個學科交叉的部分。 Neural Networks中的基本單元：神經元。從電腦科學的角度，NN就是一個包含了大量引數的數學模型，該模型由若干個函式相互代入而

機器學習（西瓜書）學習筆記（三）---------決策樹

1、基本流程決策樹通常從一個最基本的問題出發，通過這個判定問題來對某個“屬性”進行“測試”，根據測試的結果來決定匯出結論還是匯出進一步的判定問題，當然，這個判定範圍是在上次決策結果的限定範圍之內的。出發點

機器學習（西瓜書）學習筆記（二）---------線性模型

1、基本形式對含有d個特徵的資料x，線性模型試圖學得一個通過特徵的線性組合來進行預測的函式：

機器學習基石筆記-Lecture 3 Types of learning

mage 針對也有 tac nts 反饋機器學習 ear odi 介紹了機器學習中的幾類問題劃分。半監督學習能夠避免標記成本昂貴的問題。強化學習，可以看做是從反饋機制中來學習。在線學習，數據一個接一個地產生並交給算法模型線上叠代。主動學習，機器能

[吳恩達機器學習筆記]15.1-3非監督學習異常檢測算法/高斯回回歸模型

閾值訓練集 jpg -a 情況 color 訓練 ase 需要 15.異常檢測 Anomaly detection 覺得有用的話,歡迎一起討論相互學習~Follow Me 15.1問題動機 Problem motivation 飛機引擎異常檢測假想你是一個飛機引擎制造

機器學習實戰讀書筆記(3)--樸素貝葉斯

基於貝葉斯決策理論的分類方法優點:在資料較少的情況下仍然有效,可以處理多類別問題缺點:對輸入資料的準備方式比較敏感,需要標稱資料.確定貝葉斯最優假設的計算代價較大樸素貝葉斯是貝葉斯決策理論的一部分.貝葉斯決策理論的核心思想:一個數據集包括2類(或兩類以上

【原】Andrew Ng斯坦福機器學習 Coursera—Programming Exercise 3 邏輯迴歸多分類和神經網路

作業說明 Exercise 3，Week 4，使用Octave實現手寫數字0-9的識別，採用兩種方式（1）邏輯迴歸多分類（2）三層神經網路多分類。對比結果。每張圖片20px * 20px，也就是一共400個特徵（因為Octave裡從1開始。所以將0對映為10）（1）邏輯迴歸多分類：實現 lrCost

[吳恩達機器學習筆記]15.1-3非監督學習異常檢測演算法/高斯回回歸模型

15.異常檢測 Anomaly detection 覺得有用的話,歡迎一起討論相互學習~Follow Me 15.1問題動機 Problem motivation 飛機引擎異常檢測

機器學習與Tensorflow（3）—— 機器學習及MNIST資料集分類優化

一、二次代價函式 1. 形式：其中，C為代價函式，X表示樣本，Y表示實際值，a表示輸出值，n為樣本總數 2. 利用梯度下降法調整權值引數大小，推導過程如下圖所示：根據結果可得，權重w和偏置b的梯度跟啟用函式的梯度成正比（即啟用函式的梯度越大，w和b的大小調整的越快，訓練速度

學習筆記 | 機器學習-周志華 | 3

1.4 歸納偏好版本空間中的多個假設可能會產生不同的輸出：對於同一個樣本，產生不同結果。這時，學習演算法本身的"偏好"就會起到關鍵的作用. 機器學習演算法在學習過程中對某種型別假設的偏好，稱為"歸納偏好" (inductive bias),或簡稱為"偏好"。任何

機器學習數學原理（3）——生成型學習演算法

機器學習數學原理（3）——生成型學習演算法在上一篇博文中我們通過廣義線性模型匯出了針對二分類的Sigmoid迴歸模型以及針對多項分類的Softmax迴歸模型，需要說明的是，這兩種演算法模型都屬於判別學習演算法，而這篇博文主要分析了與之區別的生成型學習演算法。生成型學習演算法與判別學

斯坦福大學(吳恩達) 機器學習課後習題詳解第七週程式設計題 SVM

作業下載地址：https://download.csdn.net/download/wwangfabei1989/103046171. 高斯核函式gaussianKernelfunction sim = gaussianKernel(x1, x2, sigma)%RBFKER

吳恩達機器學習筆記--第二週-3.解析法計算引數

week2-3.Computing Parameters Analytically一、Normal Equation正規方程（normal equation）用求（偏）導的方法求最值（若是多元變數函式，需要對每個變數求偏導，然後令他們都為0）：使用正規方程求J函式最值：構建設

西瓜書《機器學習》課後答案——Chapter3_3.3

相關推薦