機器學習（周志華版）學習筆記（三）歸納偏好

阿新 • • 發佈：2019-01-07

定義：機器學習演算法在學習過程中對某種型別假設的偏好。

每種演算法必有其歸納偏好，否則它將被假設空間中看似在訓練集上“等效”的假設所迷惑，無法產生確定的學習結果。

例子理解：

編號	色澤	根蒂	敲聲	好瓜
1	青綠	蜷縮	濁響	是
2	烏黑	蜷縮	濁響	是
3	青綠	硬挺	清脆	否
4	烏黑	稍蜷	沉悶	否

西瓜的好壞到底取決於三種特徵的哪一種或幾種，根據編號1和2可以假設的影響因素為：

1.根蒂+敲聲

2.根蒂

3.敲聲

如果沒有歸納偏好，擇無法確定具體的影響好瓜的特徵，如果一個測試用例為烏黑、蜷縮、清脆則不確定採取以上三種那種方式進行判斷：可能用1判斷為壞瓜，可能用2判斷為好瓜，可能用3判斷為壞瓜

假設歸納偏好為2，則直接判斷該瓜（烏黑、蜷縮、清脆）為好瓜。

奧卡姆剃刀（歸納偏好原理）：

若有多個假設與觀察一致，則選擇最簡單的那個。哪個才是最簡單的呢，這就需要對應不同的演算法，所以引出了問題，哪種演算法才是最好的呢？

NFL（沒有免費的午餐）原則：

假設的誤差與學習演算法無關！學習演算法沒有好壞之分，不能脫離具體問題，要根據實際問題選取相應的學習演算法

證明過程：

(3) 式：由於假設“真實目標函式對所有可能的 f 均勻分佈”，故對所有 f 求和後，任意假設 h 的準確率期望為一半。又由於 1 在正確時取 1 反之為 0，故(2) 式末尾對 f 的求和得到的值為假設空間個數的一半，即得 (3) 式。

(5) 式：即簡單的概率求和，P(h|X,a) 對 h 求和當然就是 1了。還不理解的話？其實就是 P(A|B) 對 A 求和的形式。

可知演算法a和演算法b的誤差是相同的

機器學習（周志華版）學習筆記（三）歸納偏好

定義：機器學習演算法在學習過程中對某種型別假設的偏好。每種演算法必有其歸納偏好，否則它將被假設空間中看似在訓練集上“等效”的假設所迷惑，無法產生確定的學習結果。例子理解：編號色澤根蒂敲聲好瓜 1 青綠蜷縮濁響是

《機器學習》 --周志華版（西瓜書）--課後參考答案

開始學習周志華版的《機器學習》，將別人寫的課後習題的參考答案儲存下來供參考。目錄：參考：http://blog.csdn.net/snoopy_yuan/article/details/62045353

《機器學習》-周志華版學習筆記目錄

原定於11月分完成周志華老師所著的《機器學習》的學習，並整理出學習筆記的計劃，截至今天總算是基本完成了。中間出了一趟差，周內的還需要做一些專案上的工作，其實時間還是非常的緊的，所以每天基本是上是早上看書，下午專案，晚上總結筆記這樣一個時間安排。有的時候真的是看不進去，也不理解，就想著

《機器學習》(周志華)西瓜書讀書筆記(完結)

《機器學習》(周志華)西瓜書讀書筆記(完結) 閱讀目錄第1章緒論第2章模型評估與選擇第3章線性模型第4章決策樹第5章神經網路第6章支援向量機第7章

《機器學習》(周志華)西瓜書讀書筆記

回到頂部第1章緒論對於一個學習演算法a,若它在某問題上比學習演算法b好,則必然存在另一些問題,在那裡b比a好.即"沒有免費的午餐"定理(No Free Lunch Theorem,NFL).因此要談論演算法的相對優劣,必須要針對具體的學習問題回到頂部第2章模型評估與選擇

《機器學習》 --周誌華版（西瓜書）--課後參考答案

snoopy 實踐評估 ref 得到 clas tle car 分析《機器學習》 --周誌華版（西瓜書）--課後參考答案對機器學習一直很感興趣，也曾閱讀過李航老師的《統計學習導論》和Springer的《統計學習導論-基於R應用》等相關書籍，但總感覺自己缺乏深入

《機器學習》周誌華版（西瓜書）--課後參考答案

卷積 id3 理論分類器特征選擇 sin 監督學習答案第十四第一章緒論 http://blog.csdn.net/icefire_tyh/article/details/52065224 第二章模型評估與選擇 http://blog.csdn.net/icef

《機器學習》周志華學習筆記第四章決策樹（課後習題）python 實現

一、基本內容 1.基本流程決策樹的生成過程是一個遞迴過程，有三種情形會導致遞迴返回（1）當前節點包含的yangben全屬於同一類別，無需劃分；（2）當前屬性集為空，或是所有yangben在所有屬性上的取值相同，無法劃分；（3）當前結點包含的yangben集合為空，不能

《機器學習》周志華學習筆記第三章線性模型（課後習題）python 實現

線性模型一、內容 1.基本形式 2.線性迴歸：均方誤差是迴歸任務中最常用的效能度量 3.對數機率迴歸：對數機率函式（logistic function）對率函式是任意階可導的凸函式，這是非常重要的性質。 4.線性判別分析（LDA 是一種降維的方法） 5.多分類學習：

《機器學習》周志華學習筆記第八章整合學習（課後習題）python實現

1.個體與整合 1.1同質整合 1.2異質整合 2.boosting:代表AdaBoost演算法 3.Bagging與隨機森林 3.1Bagging 是並行式整合學習方法最著名的代表（基於自主取樣法bootstrap sampling）自己學習時編寫了

《機器學習》周志華學習筆記第六章支援向量機（課後習題）python 實現

一、 1.間隔與支援向量 2.對偶問題 3.核函式 xi與xj在特徵空間的內積等於他們在原始yangben空間中通過函式k(.,.)計算的結果。核矩陣K總是半正定的。 4.軟間隔與正則化軟間隔允許某些samples不滿足約束鬆弛變數 5.支援

《機器學習》周志華學習筆記第五章神經網路（課後習題） python實現

1.神經元模型 2.感知機與多層網路 3.誤差逆傳播演算法 (A)BP演算法：最小化訓練集D上的累積誤差標準BP演算法：更新規則基於單個Ek推導而得兩種策略防止過擬合：（1）早停（通過驗證集來判斷，訓練集誤差降低，驗證集誤差升高）（2）正則化：在誤差目標函式中引入描述網

《機器學習》周志華學習筆記第七章貝葉斯分類器（課後習題）python 實現

課後習題答案 1.試用極大似然法估算西瓜集3.0中前3個屬性的類條件概率。好瓜有8個，壞瓜有9個屬性色澤，根蒂，敲聲，因為是離散屬性，根據公式（7.17） P(色澤=青綠|好瓜=是) = 3/8 P(色澤=烏黑|好瓜=是) = 4/8 P(色澤=淺白|好瓜=是) =

《機器學習》周志華學習筆記第十四章概率圖模型（課後習題）python實現

一、基本內容 1.隱馬爾可夫模型 1.1. 假定所有關心的變數集合為Y,可觀測變數集合為O,其他變數集合為R, 生成式模型考慮聯合分佈P(Y,R,O),判別式模型考慮條件分佈P(Y,R|O)，給定一組觀測變數值，推斷就是要由P(Y,R,O)或者P(Y,R|O)得到條件概率分佈P(Y,

《機器學習》周志華讀書筆記2（原創）

第2章模型評估與選擇 p24-p51 2017-2-24 Fri Model selection模型選擇：選用哪種學習演算法、使用哪種引數配置（理想的解決方案：對候選模型的泛化誤差進行評估，再選擇泛化誤差最小的那個模型）（通過實驗來對學習器的泛化誤差進行評估並進而做

《機器學習》周志華讀書筆記1（原創）

第1章 p1-p23 2017-2-20 Mon 模型：泛指從資料中學得的結果 Instance示例（或sample樣本）：每條記錄的資料。每條記錄是關於一個事件或物件的描述。 Data set資料集:記錄資料的集合 Attribute屬性（或feature特徵）：反映事

《機器學習（周志華）》——第6章支援向量機

1、間隔與支援向量（1）分類學習的最基本思想就是：基於訓練集D在樣本空間中找到一個劃分超平面，將不同類別的樣本分開。（2）在樣本空間中，用線性方程來表示劃分超平面：ωTx + b = 0 ；其中ω = (ω1;ω2; … ; ωd)為法向量，決定超平面內的方向；b

機器學習-第五章神經網路讀書筆記（周志華）

前言博主第一次接觸機器學習，內容可能有許多原文復現，但是我儘量用自己的話來講，覺得寫得還行的話點個喜歡，謝謝！讀書筆記第一目的是為了總結，第二是順便在部落格上記錄我的學習歷程，同時也希望讀者能有一點點收穫吧~如果不對的地方，還請多多指教！正文周志華的機器學習第五章講的是關於神

《機器學習（周志華西瓜書）》學習筆記1：第三章-線性模型

一、線性迴歸線性迴歸的基本思想是採用對輸入樣例各個特徵進行線性加權的方式得到預測的輸出，並將預測的輸出和真實值的均方誤差最小化。1）如果輸入樣例只有一個特徵，那這個過程就是用一條直線去擬合平面直角座標系上的點； 2）如果有兩個特徵，表現在平面直角座標系上就是用一條

機器學習（周志華）習題3.3

本人菜鳥一枚，由於需要完成作業，所以嘗試使用機器學習工具庫去解決該題（周志華《機器學習》3.3題），主要參考別人的程式碼進行了改寫，如有不足請多多指教！以下附上本題程式碼 import tensorflow as tf fro

機器學習（周志華版）學習筆記（三）歸納偏好

相關推薦