吳恩達機器學習學習筆記之一監督學習和無監督學習

阿新 • • 發佈：2019-01-18

一、

1-1 welcome

1-2 什麼是機器學習——Machine Learning

機器學習尚無明確定義，現有的定義有：

（1）Field of study that gives computers the ability to learn about being explicity (明確地) programmed. ——Arthur Samuel 機器學習做什麼

機器學習是一個學習領域，並在沒有明確訓練的情況下，交給計算機學習的能力。

注：該定義之所以成名，是因為Samuel編寫了一個跳棋程式。該程式使計算機自己與自己下棋，通過成百上千次的訓練、觀察，逐漸學會哪些是好的佈局，最終計算機成為一個跳棋高手，儘管其創作者Samuel並不擅長跳棋遊戲。

（2）A computer program is said to learn from experience E with respect to some task T and some performance measure P , if its performance on T , as measured by P , improved with experience E. —— Tom Mitchell 良好的學習問題是什麼

計算機程式從經驗E中學習任務T，並用度量P來衡量效能。條件是它（由P衡量的）關於T的效能隨著經驗E而提高。

對於跳棋遊戲，經驗E就是計算機與自己玩10次，1000次的跳棋；任務T就是玩跳棋的任務；效能度量P就是與新對手玩跳棋時贏的概率。

後面將會講不同型別的學習演算法，主要有兩類：監督學習（Supervised learning）和非監督學習（Unsupervised learning）。

監督學習：我們教計算機如何做事情。

非監督學習：計算機自己學習。

其他的學習演算法，例如增強學習（Reinforcement learning）和推薦系統（recommender systems）。

1-3 監督學習——Supervised Learning

本節講述機器學習的最普通型別是什麼，哪些是監督學習。 例1：預測房屋價格 例子，假設想要預測房屋價格，繪製了下面這樣的資料集。水平軸上，不同房屋的尺寸是平方英尺，在豎直軸上，是不同房子的價格，單位時（千萬$）。給定資料，假設一個人有一棟房子，750平方英尺，他要賣掉這棟房子，想知道能賣多少錢。

那麼學習演算法能做的事是什麼呢？可能是根據資料畫一條直線或者說用一條直線擬合數據。看上去，可能會賣150K美元。

但是，這不是唯一的學習演算法，可能有更好的。例如，不是用一條直線擬合數據，而是用一個二次函式或二階多項式來擬合數據，這樣效果可能會更好。在這種情況下，該房子可能會賣到200K美元。後面要討論的就是如何選擇，決定用直線還是二次函式進行擬合。這是監督學習的很好的例子，監督學習是指我們給演算法一個數據集，並且給定正確答案。也就是說，我們給定一個房屋資料集，在這個資料集中的每個例子，我們都給出正確的價格，也即這個房子賣出的實際價格。演算法的目的就是給出更多的正確答案，例如對待售房子，假如想要給待售的房子估價，這也稱為迴歸問題（Regression ： Predict continuous value output——price）。之所以稱為迴歸問題，是因為其預測連續的輸出值，即價格。 例2：估計腫瘤性質 另一個例子，假設想要看醫療記錄，並且想設法預測乳腺癌是惡性的還是良性的。假設某人發現了一個乳腺瘤，在乳腺上有個z腫塊，惡性瘤是危險的、有害的；良性瘤是無害的。假設在資料集中，水平軸是瘤的尺寸，豎直軸是1或0，也可以是Y或N。在已知腫瘤樣例中，惡性的標為1，良性的標為0。那麼，如下，藍色的樣例便是良性的，紅色的是惡性的。

假設一個人得了乳腺癌（即圖中紫紅色箭頭指示的樣例），機器學習的任務就是估計該腫瘤的性質，是惡性的還是良性的。引入一個更專業的術語，這就是一個分類問題（calssification problem）。 Classification refers to the fact that here we're trying to predict a discrete value output : zero or one , malignant or benign . 分類是指預測一個連續的輸出值，0或1，惡性或良性。在分類問題中，可以輸出多於兩個值。在實際例子中，可能有三中型別的乳腺癌。因此，要預測離散值0,1,2,3，其中0是良性的。1、2、3分別代表癌症1，癌症2，癌症3。可以用另一種方法來表示這些資料，用不同的符號集來繪製這組資料。假設瘤的尺寸是用來預測惡性或良性的特徵。用不同的符號表示良性或惡性，或說反例和正例。我們可以用圈表示良性，繼續用紅叉表示惡性，把資料集對映到這條實線上。

1-4 非監督學習 —— Unsupervised Learning

在上節的監督學習當中，所有的樣本都被標為正樣本或負樣本，即良性或惡性。因此監督學習的樣本，已經知道了明確的“正確答案”，即是良性還是惡性。

而在無監督學習中，給定的樣本沒有“正確答案”，即標籤，所有的資料都是一樣的。無監督學習的任務是從給定的資料集中，找出可能具有的結構。

對於上圖中的資料，無監督學習演算法可能將其分為兩類，這就是聚類演算法（Clustering Algorithm）。現舉一個聚類演算法的例子，Google搜尋中，將所有的新聞收集到一起，然後將其分類。在基因組學中的應用，基因晶片，給定一組不同的個體，檢查每個個體是夠擁有某個特定的基因。執行一個聚類演算法，將不同的個體歸入不同的類。形象來說，就是我們有一堆資料，不知道這些資料有什麼型別，希望演算法能自動找出可能的型別，並自動將其分類。即將相似的聚合在一類。再舉一些監督學習和無監督學習的例子：無監督：用於管理計算機叢集，在一個計算機管理中心，找出哪些計算機在進行著協同工作，就可以讓資料中心更高效的工作。無監督：用於社交網路的分析，若知道某人的各種賬號的好友，例如QQ、微信、FaceBook等，就能知道哪些好友是一個好友組，哪些僅僅是互相認識的好友。無監督：很多公司有大型的客戶資訊資料庫，給出一個客戶資料集，自動找出不同的市場分割，並自動將客戶分到細分市場中，從而在不同的細分市場中進行更有效的銷售。。在這裡事先並不知道有哪些細分市場。

吳恩達機器學習學習筆記之一監督學習和無監督學習

一、

1-1 welcome

1-2 什麼是機器學習——Machine Learning

1-3 監督學習——Supervised Learning

1-4 非監督學習 —— Unsupervised Learning

吳恩達機器學習學習筆記之二：代價函式和梯度下降演算法

吳恩達機器學習學習筆記之一監督學習和無監督學習

Coursera 深度學習吳恩達 deep learning.ai 筆記整理（3-2）——機器學習策略

吳恩達“機器學習”——學習筆記二

吳恩達“機器學習”——學習筆記八

【吳恩達機器學習】學習筆記——1.5無監督學習

【吳恩達機器學習】學習筆記——2.1單變量線性回歸算法

【吳恩達機器學習】學習筆記——代價函數

【吳恩達機器學習】學習筆記——梯度下降

【吳恩達機器學習】學習筆記——2.7第一個學習算法=線性回歸+梯度下降

Coursera-AndrewNg(吳恩達)機器學習筆記——第三周

吳恩達機器學習筆記 —— 5 多變量線性回歸

吳恩達機器學習筆記 —— 9 神經網絡學習

吳恩達機器學習筆記（六） —— 支持向量機SVM

吳恩達機器學習筆記 —— 17 推薦系統

吳恩達機器學習筆記 —— 12 機器學習系統設計

吳恩達機器學習筆記 —— 14 無監督學習

吳恩達機器學習筆記 —— 19 應用舉例：照片OCR（光學字符識別）

吳恩達機器學習筆記 —— 11 應用機器學習的建議

吳恩達機器學習筆記

吳恩達機器學習 學習筆記 之 一 監督學習和無監督學習

一、

1-1 welcome

1-2 什麼是機器學習——Machine Learning

1-3 監督學習——Supervised Learning

1-4 非監督學習 —— Unsupervised Learning

相關推薦

吳恩達機器學習學習筆記之一監督學習和無監督學習