1. 程式人生 > >【機器學習】加州理工學院公開課——機器學習與資料探勘 1.學習問題

【機器學習】加州理工學院公開課——機器學習與資料探勘 1.學習問題

一、概念形式化

輸入:x

輸出:y

目標函式:F:x → y

資料:(x1, y1), (x2, y2), …, (xN, yN)

假設函式:g:x → y

假設集:H={h},   G∈H

(假設集有助於理解是否用這個演算法及用這個演算法之後效果怎樣。)

(F函式是未知的,是機器學習的一個目標,運用資料和例子來做出假設,得到G函式。G值和F值是很接近的,但F是未知的,G是已知的。最終是希望G無限接近於F)

二、簡單的機器學習過程

     

     

       解決機器學習問題的兩個組成成分:

       1、假設集H

       2、學習演算法

       以上兩者相結合,就組成了一個機器學習的模型(感知器學習模型)。

     機器學習的目的是找到一個最好的學習方法,這個方法可以最小化目標函式(類似於誤差函式)。學習演算法和假設集是我們學習的工具。 最終假設是要得到的結果。


三、機器學習的本質

1、存在一個模式\模型——例如:一個人評價電影的方法

2、不能用數學來確定它——無法寫出某些數或多項式來評價它

3、有資料——從資料入手進行研究