1. 程式人生 > >機器學習基石 Lecture1: The Learning Problem

機器學習基石 Lecture1: The Learning Problem

機器學習基石 Lecture1: The Learning Problem

Course Introduction

Course Design

機器學習是個既包含理論也需要實踐的內容。本門課更注重基礎理論一點。包含了感性認識,關鍵理論,核心技術和實際的用途。包括以下內容:
在這裡插入圖片描述

What is Machine Learning

定義

人類學習:通過觀察獲得經驗取得技能。
機器學習:通過資料學得經驗獲取技能。一個更具體的定義如下:
在這裡插入圖片描述
機器學習通過從資料中獲得的經驗,從而提高了在某些評估中的表現。比如從過往股票交易的資料中得到一個能夠提高投資收益的演算法。

為何使用機器學習呢?若需要寫一個辨別樹的程式。如果想要先定義一棵樹,然後根據定義來寫一個判斷的程式非常困難。而實際上人不是根據定義來識別樹而是根據觀察(資料)。基於機器學習的樹辨別系統比硬編碼的方式更加簡單。

Key Essence of Machine Learning

  1. 需要有一些能夠學習潛在的模式,從而提高效率
  2. 但沒有一些簡單的可直接程式設計的定義,所以需要ML
  3. 而且需要有關於這些模式的資料,這是ML需要的輸入

有了這幾個元素的地方才適合使用機器學習。

Applications of Machine Learning

衣:時裝搭配
食:預測飯店是否會導致食物中毒
住:節能減排的能耗安排
行:自動駕駛識別交通指示
育:根據學習記錄預測學生成績
樂:電影或音樂推薦系統

Components of Learning

在這裡插入圖片描述
在這裡插入圖片描述
機器學習裡的基礎概念:

  • 輸入x
  • 輸出y
  • 實際的從輸入集合到輸出集合的對映函式f,無法知道
  • 訓練資料D,由一個一個輸入輸出對(x,y)組成
  • 對於實際函式f的假設函式g,也就是學到的能夠有較好表現的技能。

因此機器學習就是從由 f f 生成的(x,y)資料對中,通過演算法 A A 來從所有的假設函式的集合 H H 中學到一個對於實際函式f的估計函式g。

Machine Learning and Other Fields

機器學習:從資料中學習到假設g去逼近目標f

資料探勘:使用大量資料找到有意義的性質
相比:兩個很難區分但是並不相同

人工智慧:計算一些能夠體現出智慧的東西
相比:ML可以看做實現AI的方式

統計學:通過資料對未知過程進行推導
相比:統計學可以看成ML的工具