1. 程式人生 > >【吳恩達機器學習隨筆】什麽是機器學習?

【吳恩達機器學習隨筆】什麽是機器學習?

都是 mea 預測 learn 會有 code 度量 its 價格

定義 

  Tom Mitchell對機器學習定義為“計算機從經驗E中學習,解決某一任務T,進行某一度量P,通過P測定在T上的表現因經驗E而提高”。定義個人覺得大體理解即可,如果扣文咬字去理解會十分痛苦,就不做過多解釋了。

原文:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E. 

分類

  Supervised learning

  監督性學習是指“我們已有數據集,並且該數據集裏面對於一個輸入,我們是知道正確的輸出結果的。”,這個定義非常重要,也是區分監督性學習和非監督性學習明顯分界性。監督性學習問題又分為regression(回歸)和classification(分類)。

  在滿足監督性學習問題前提下,對一個求解的問題,如果判斷它是屬於回歸還是分類範疇?

  首先看個人理解定義:求解問題結果是連續的還是離散的,如果是連續的就是回歸問題,離散的就是分類問題。

  再舉個例子加深理解:假設我們手頭上有一份數據為廣州所有樓盤的均價數據集。如果要預測距離市中心500米樓盤價格,我們也許就會以數據集建立這樣的一個數學模型,一個坐標軸,x軸代表距離市中心距離,y軸為樓盤價格。套用機器學習定義,我們的任務T是要預測記錄市中心N米的樓盤價格,而度量P就是預測價格準確性,經驗E就是我們數據集,數據集數據越多對我們預測結果將會有正向作用。在這個例子了樓盤價格(y軸)曲線明顯是一個連續的值,因此屬於回歸問題。

  相同的數據集,如果我們要預測問題是距離市中心500米樓盤價格是高於還是低於廣州均價。也許坐標軸我們就會這樣去表示,y軸只有0和1,0代表低於均價,1代表高於均價。x軸為距離市中心距離。在這個例子明顯y軸值是離散的,因為屬於分類問題。實際上分類問題離散值類別可能不止只有0和1,而是有多個,但無論多少個,類別種類是確定的,這一點也是分類問題明顯特性。

  Unsupervised learning

  與監督性學習不同的是非監督性學習“同樣有數據集,但沒有該數據集的任何標簽信息,也就是一堆沒有答案的數據”,而非監督性學習目標就是我們可以通過算法從數據集能把相同特征或者是相似的數據歸類。其中可以分為Clustering(聚類)和Non-clustering(非聚類)算法。對於聚類和非聚類可以這樣理解,他們都是對數據集數據進行歸類,但是聚類可以把一堆數據集按照某個標準或者特征對相似數據劃分為一個類別,而非聚類算法可以從數據集一堆數據中發現相同數據結構數據(如Cocktail Party Algorithm算法,能在嘈雜聲音環境中把人說話的聲音和背景音樂聲音找出來)。

【吳恩達機器學習隨筆】什麽是機器學習?