1. 程式人生 > >機器學習定義、機器學習與資料建模、分析的區別

機器學習定義、機器學習與資料建模、分析的區別

一、什麼是機器學習?

先來看一則開場白:
這裡寫圖片描述
看完這段話,可以發現這裡涉及了很多基於“經驗”而做出的判斷。換句話說就是:通過對經驗的利用,就能對新的情況做出有效的決策。

**

機器學習定義是什麼呢:

**筆者摘錄了兩則,大家批評接受
—>①:機器學習它致力於研究如何通過計算手段,利用“經驗”來改善系統自身的效能。計算機裡“經驗”通常以“資料”形式存在,因此機器學習所研究的主要內容,是關於計算機上從資料中產生“模型”的演算法(也叫“學習演算法”)。有了學習演算法,我們把經驗資料輸入,計算機就能基於已有資料建立模型。當面臨新情況(新資料)時,模型會給我們提供相應的判斷。簡短來說,機器學習是研究關於“學習演算法”的學問。(摘錄周志華《機器學習》)
—>②:機器學習就是通過演算法,使得機器能從大量歷史資料中學習規律,從而對新的樣本做智慧識別或預測。(摘錄吳岸城《神經網路與深度學習》)

—> 筆者小注:兩則定義選取角度不同,各從內涵外延出發進行闡述。機器學習主體研究還是各種演算法,通過演算法對新資料進行預測,同時也包含資料模型的建立與分析。

—-—-—-—-—-—-—-—-—-—-—-—–—-—-—-—-—-—-—-—-—-—-

依據機器學習的方式分類

先了解一下會用到的基本術語:

  • 學習:從資料中學得模型的過程,也叫訓練
  • 訓練集:訓練過程使用的資料叫訓練資料,單獨一條資料叫訓練樣本,訓練樣本全體組成訓練集
  • 學習器:就是依照部分資料建立的模型
  • 泛化能力:學得模型適用於新樣本的能力
    —-—-—-—-—-—-—-—-—-—-—-—–—-—-—-—-—-

    —-—-—-—-—-
    —-—-—-—-—-—-—-—-—-—-—-—–—-—-—-—-—-—-—-—-—-—--
    依照預測值是離散的、連續值的劃分:
    1、預測值是:離散值–—-—-這類學習任務稱為“分類”。
    “二分類”任務,通常稱其中一個為“正類”,另一個為“反類”
    2、預測值是:連續值–—-—-這類學習任務稱為“迴歸”。
    3、將訓練集分成若干個組,每個組稱為一個簇,這種方法叫“聚類
    —-—-—-—-—-—-—-—-—-—-—-—–—-—-—-—-—-—-—-—-—-—--
    依照訓練資料是否擁有標記資訊的劃分:

  • 監督學習:資料有表徵項,得到的模型預測結果能與原資料中表徵項進行比較。例如:我們通過訓練樣本中西瓜的外形、紋理,以及對應每個瓜是好瓜還是壞瓜(好/壞瓜就是表徵項)建立模型,再用檢驗樣本去驗證,得到的檢驗樣本的預測結果與檢驗樣本表徵項進行比較,就可以看出模型預測的準確性(學習器的學習能力)。代表有分類、迴歸等。

  • 無監督學習:資料沒有表徵項,也就是沒有人為標定好的訓練資料,沒有告訴模型中哪些資料是正確的,哪些是錯誤的。需要學習模型推斷出資料的內在結構。例如在蘋果香蕉混合的果籃中,機器依照不同特徵將這兩種水果分開。代表有關聯規則的學習、聚類。常用演算法有Apriori演算法,K-Means演算法等。

  • 強化學習(RL):強化學習其實就是一個連續決策的過程。傳統的機器學習中的監督學習是給定一些表徵項,學習一個好的函式,對未知資料能做出很好的決策。但是有些時候,我們不知道表徵項是什麼,不知道好壞怎麼區分,所以RL不是給定表徵,而是給出一個回報函式,回報函式決定當前狀態得到什麼樣的結果。雖然這個過程有點像監督學習,區別在於表徵項不是預先準備的,而是通過一個個的學習過程來回調整機器學習到的“表徵項”

—-—-—-—-—-—-—-—-—-—-—-—–—-—-—-—-—-—-—-—-—-—-
—-—-—-—-—-—-—-—-—-—-—-—–—-—-—-—-—-—-—-—-—-—-
—-—-—-—-—-—-—-—-—-—-—-—–—-—-—-—-—-—-—-—-—-—-

二、機器學習與資料建模、分析的區別

機器學習算是人工智慧研究的一個分支,而人工智慧又包含在當今大資料熱潮中,所以機器學習與資料建模、資料分析有相似重疊,但在以下兩點還是相差頗大。

1、資料輸入量:資料建模、資料分析針對於可見量資料,在這些可見量資料上進行後續的分析,而機器學習的資料輸入量相當龐大。打個比方就是,機器學習的資料量是一片大海,而資料建模、資料分析的資料量就猶如一灘海浪。我們能遇見一灘又一灘的海浪成型並輕撫海岸,卻始終見不了大海的全貌。
2、研究目的:資料建模、資料分析致力於找尋合適的模型,依照模型給出最優。而機器學習重視的是,隨著各種資料的輸入,這些資料呈現的狀態各是如何,再依照資料狀態給出合理預測。