python實現周志華西瓜書《機器學習》習題3.3對數機率迴歸

阿新 • • 發佈：2018-11-11

python小白入手，第一個程式。
首先感謝大牛的原始碼：

https://blog.csdn.net/onthewaygogoing/article/details/68485682

大牛的思路很巧妙，把矩陣操作轉化成列表操作，時刻保證列表代表的矩陣維度一致。
我貢獻的內容就是比較詳細的註釋，希望幫助更多的小白一起看懂

#程式碼基本是抄https://blog.csdn.net/onthewaygogoing/article/details/68485682
import numpy as np
#linalg是線性代數模組，包括求範數
from numpy import linalg
#pandas是匯入表格資料的方法，詳見http://codingpy.com/article/a-quick-intro-to-pandas/ 

import pandas as pd
#定義excel檔案的讀取路徑
inputfile='/Users/huatong/PycharmProjects/Data/xiguaexcel.xls'
#讀取資料檔案，引數只填路徑就可以
data_original=pd.read_excel(inputfile)
#βTx實際上是β乘x的轉置。這裡的beta是書裡已經轉置過的，x是第一行密度，第二行含糖量的矩陣，下面的x也就是書裡的x^=(x;1)的轉置。
#numpy array用於構造陣列。read_excel讀取出的資料是元組結構tuple。列表可讀寫元組只讀。list用於把元組轉換成列表，也就是把表格資料打散。單引號指定某一列 

x=np.array([list(data_original['density']),list(data_original['suger']),[1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]])
#y是是否好瓜，因為後面βTx的結果是一行，y也就是一行了
y=np.array(list(data_original['good']))
#定義初始引數，注意這個beta是書裡β=(w;b）的轉置
beta=np.array([[0],[0],[1]])
#3.27式的l(β）,是上一次迭代的l值
old_l=0
#n是迭代次數
n=0

#迭代
while 1:
    #numpy dot是矩陣相乘，numpy T是求轉置矩陣，因為β轉置後只有一行，只需要轉置後第一行與x^相乘 

    beta_T_X=np.dot(beta.T[0],x)  #python沒有陣列概念，後面的beta_T_x[i]也就是列表中i元素的數值
    cur_l=0  #初始化l值，以下求和
    for i in range(17):
        cur_l=cur_l+(-y[i]*beta_T_X[i]+np.log(1+np.exp(beta_T_X[i]))) #式3.27，目標是求使得這個值最小的β

    #迭代終止條件
    if np.abs(cur_l-old_l)<=0.000001: #abs求絕對值，相差小於0.000001認為收斂
        break

    #牛頓法更新β，根據式3.29到3.31
    n=n+1
    old_l=cur_l
    dbeta=0  #一階導，下面是二階導
    d2beta=0
    for i in range(17):
        #這裡的x是轉置後的，因此這一步要再轉置回來
        dbeta=dbeta-np.dot(np.array([x[:,i]]).T,(y[i]-(np.exp(beta_T_X[i])/(1+np.exp(beta_T_X[i])))))
        d2beta=d2beta+np.dot(np.array([x[:,i]]).T,np.array([x[:,i]]).T.T)*(np.exp(beta_T_X[i])/(1+np.exp(beta_T_X[i])))*(1-(np.exp(beta_T_X[i])/(1+np.exp(beta_T_X[i]))))
    beta=beta-np.dot(linalg.inv(d2beta),dbeta)  #inv是矩陣求逆
print('模型引數是：',beta)
print('迭代次數：',n)

python實現周志華西瓜書《機器學習》習題3.5LDA判別

本題感謝大神 https://blog.csdn.net/Snoopy_Yuan/article/details/64443841 #抄https://blog.csdn.net/Snoopy_Yuan/article/details/64443841 import numpy as n

python實現周志華西瓜書《機器學習》習題3.4 對比10折交叉驗證和留一法的對率迴歸錯誤率

這道題仍然在抄大神程式碼的基礎上寫註釋，首先感謝原始碼： https://blog.csdn.net/Snoopy_Yuan/article/details/64131129 感想是：sklearn是個好東西，如果沒有現成的驗證方法，光是10折驗證就要造10個表格才行，而用現成的庫，一

python實現周志華西瓜書《機器學習》習題3.3對數機率迴歸

python小白入手，第一個程式。首先感謝大牛的原始碼： https://blog.csdn.net/onthewaygogoing/article/details/68485682 大牛的思路很巧妙，把矩陣操作轉化成列表操作，時刻保證列表代表的矩陣維度一致。我

《機器學習》(周志華)西瓜書讀書筆記(完結)

《機器學習》(周志華)西瓜書讀書筆記(完結) 閱讀目錄第1章緒論第2章模型評估與選擇第3章線性模型第4章決策樹第5章神經網路第6章支援向量機第7章

周志華西瓜書《機器學習》第三章線性模型

又好像很久更新了，但這幾天我都有在學習哦~。一位同學和我說感覺我的筆記很多是對書本原文的再現，缺少自己的思考和重點提煉。我反思了一下好像真的是這樣的呢，這樣子寫似乎的確是和原文沒有多大的區別（而且敲那麼多字非常的累）。所以從這篇筆記開始我會挑選書中的重點來記錄啦，對於個別比較難理解

周志華西瓜書《機器學習筆記》學習筆記第二章《模型的評估與選擇》

本章是西瓜書的第二章，周志華老師在這一部分基礎對機器學習中的基礎知識進行介紹，主要闡述了誤差、過擬合的相關概念和模型的評估度量方法。博主在今年元旦之後就要正式開始做畢業設計了，所以我會努力在今年元旦假期結束之前把西瓜書的所有內容更新。也希望大家可以監督我嘻嘻。一、經驗誤

周志華西瓜書《機器學習筆記》學習筆記第一章《緒論》

最近在幫學弟做一個關於OCR的專案，所以這幾個星期都沒有在CSDN上更新文章。今天登入後發現有還幾個小夥伴關注我了，很開心~。我會繼續在CSDN上更新一些內容，總結自己每個階段的學習情況。周志華老師的西瓜書堪稱學習機器學習的必備書籍，很多學生包括我自己都是從這本書開始接觸機器學習。

機器學習(周志華西瓜書) 參考答案總目錄

機器學習(周志華西瓜書)參考答案總目錄從剛開始學習機器學習到現在也有幾個月了，期間看過PDF，上過MOOC，總感覺知道一點了又不是特別明白，最後趁某東買書大減價弄了幾本相關的書來看看，其中一本就是西瓜書。一口氣看了前10章，感覺每章內容都很少，看完感覺還是和以前一樣。

python 實現周志華機器學習書中 k-means 演算法

hello，all 上節採用python實現了決策樹，本節使用python實現k-means演算法，後一節將會採用map-reduce實現k-means演算法演算法程式如下：演算法程式碼如下： # coding=utf-8 import pprint import

《機器學習（周志華西瓜書）》學習筆記1：第三章-線性模型

一、線性迴歸線性迴歸的基本思想是採用對輸入樣例各個特徵進行線性加權的方式得到預測的輸出，並將預測的輸出和真實值的均方誤差最小化。1）如果輸入樣例只有一個特徵，那這個過程就是用一條直線去擬合平面直角座標系上的點； 2）如果有兩個特徵，表現在平面直角座標系上就是用一條

《機器學習》(周志華)西瓜書讀書筆記

回到頂部第1章緒論對於一個學習演算法a,若它在某問題上比學習演算法b好,則必然存在另一些問題,在那裡b比a好.即"沒有免費的午餐"定理(No Free Lunch Theorem,NFL).因此要談論演算法的相對優劣,必須要針對具體的學習問題回到頂部第2章模型評估與選擇

機器學習(周志華西瓜書) 參考答案總目錄轉載至https://blog.csdn.net/icefire_tyh/article/details/52064910

機器學習(周志華西瓜書)參考答案總目錄從剛開始學習機器學習到現在也有幾個月了，期間看過PDF，上過MOOC，總感覺知道一點了又不是特別明白，最後趁某東買書大減價弄了幾本相關的書來看看，其中一本就是西瓜書。一口氣看了前10章，感覺每章內容都很少，看完感覺還是和

python 實現周志華機器學習書中的決策樹 c3.0

hello,上篇文章實現的是svm 本文實現決策樹演算法。主要是依照周志華那本機器學習的書籍，進行實現。其中紅色部分我未寫。因為我在選擇屬性劃分的時候，不可能導致資料集為空。所以這部分對我來說沒有必要了這裡是用字典來儲存樹，開始還準備用list，發現字典要好些，但是我

周志華西瓜書第16章強化學習（習題答案）（轉）

原文轉自： https://blog.csdn.net/icefire_tyh/article/details/53691569

周志華西瓜書筆記——第一章

1.1引言概念1：基於經驗做出的預判機器學習定義：通過計算手段，利用經驗資料產生模型用於改善系統自身效能。更形式化的定義：假設用P 來評估計算機在某任務類T上的效能，若一個程式通過利用經驗E在T中任務上獲得了效能上的改善，就說關於T,P，該程式對E進行了學習。 1

機器學習定義及基本術語（根據周志華的《機器學習》概括）

機器學習的定義機器學習是這樣一門學科：通過計算的手段，學習經驗（也可以說是利用經驗）來改善系統的效能。在計算機系統中,經驗（Experience）通常是資料（Data）；學習演算法（Learning algorithm）學習產生數學模型（Model），不

機器學習（南京大學周志華的《機器學習》和李航的《統計學習方法》）

機器學習的三種不同方法：一、監督學習（supervised learning）——對未來事件進行預測。使用有類標的資料構建資料模型。然後使用經訓練得到的模型對未來的資料進行預測。主要分為兩類： 1.利用分類對類標進行預測 2.使用迴歸預測連續輸出值二、無監

機器學習（周志華）第四章習題解答

轉自：http://blog.csdn.NET/wzmsltw/article/details/51059394 本文是對周志華的《機器學習》的習題解答，文章整理的很好，為方便之後檢視，記錄如下～～～～注：本文中的程式碼均使用Python，常用工具包包括 pandas，

《機器學習》 -- 周志華（第二章學習筆記）

模型評估與選擇經驗誤差與過擬合誤差一般的把機器學習器在訓練集上的誤差成為訓練誤差或者經驗誤差在新樣本上的誤差稱為泛化誤差過擬合已經把訓練樣本自身的一些特點當做了所有潛在樣本都會具有的一般性質，這樣就會導致泛化效能下降，這樣的現象叫做

周誌華：關於機器學習的一點思考

個數報告 strong 自己兩個復雜度地面下機組織周誌華：關於機器學習的一點思考 https://mp.weixin.qq.com/s/sEZM_o5D6AhyMgvocbsFhw 演講：周誌華整理：肖琴、聞菲【新智元導讀】機器學習如今大獲成功

python實現周志華西瓜書《機器學習》習題3.3對數機率迴歸

相關推薦