1. 程式人生 > >Coursera機器學習筆記(1)--基礎介紹

Coursera機器學習筆記(1)--基礎介紹

一、機器學習概念

“A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.”

E-T-P概念:

  • E(experience): 就是之前的經驗,即用於學習的資料
  • T(task): 就是基於各種演算法的訓練過程
  • P(probability): 就是對將來概率的預測

而且這是一個迴圈,首先基於experience進行演算法分析和預測,然後用資料跑task,如果跑出來的結果和預期probability相符,則會繼續提升自身的experience,然後繼續…

二、監督學習與非監督學習

1、監督學習

在監督學習中, 我們的預測結果可以是連續值, 也可以是離散值. 我們根據這樣的屬性將監督學習氛圍迴歸問題和分類問題。

:(Regression)(Classification)

1.1 分類

資料本來具有確定的分類,機器學習結果是確定新輸入的資料屬於哪一種分類。

1.2 迴歸

資料不具備分類,機器學習結果將資料擬合成曲線,輸入新資料對應新的數值。

2、非監督學習

在監督學習中我們也提到了它與無監督學習的區別. 在無監督學習中, 我們的資料並沒有給出特定的標籤, 例如上面例子中的房價或者是良性還是惡性. 我們目標也從預測某個值或者某個分類便成了尋找資料集中特殊的或者對我們來說有價值結構. 如下圖所示, 我們可以直觀的感受到監督學習和無監督學習在資料集上的區別。