1. 程式人生 > >機器學習概念

機器學習概念

統計分析 定義 task 計算機視覺 計算機程序 數據 通過 size 包含

機器學習概念:

機器學習是一門從數據中研究算法的科學學科。機器學習直白來講,是根據已有的數據,進行算法選擇,並基於算法和數據構建模型,最終對未來進行預測。來看看大佬對機器學習的定義吧,美國卡內基梅隆大學(Carnegie Mellon University)機器學習研究領域的著名教授TomMitchell對機器學習的經典定義如下:

對於某給定的任務T,在合理的性能度量方案P的前提下,某計算機程序可以自主學習任務T的經驗E;隨著提供大量、合適、優質的經驗E,該程序對於任務T的性能會逐步提高。
其中重要的機器學習對象:

  • 任務Task T,一個或多個
  • 經驗Experience E
  • 度量性能Performance P。

我們期望隨著任務的不斷執行,經驗的累積會帶來計算機性能的提升。


機器學習的應用場景:

  • 個性化推薦:(電商商品推薦,好友推薦等)個性化指的是根據各種因素來改變用戶體驗和呈現給用戶內容,這些因素可能包含用戶的行為數據和外部因素;推薦常指系統向用戶呈現一個用戶可能感興趣的物品列表。
  • 精準營銷:(DMP,基於用戶的歷史行為,給用戶推薦各種產品)從用戶群眾中找出特定的要求的營銷對象。
  • 客戶細分:試圖將用戶群體分為不同的組,根據給定的用戶特征進行客戶分組。比如說,用戶分為VIP、高級VIP等,劃分粒度和具體場景有關
  • 預測建模及分析:根據已有的數據進行建模,並使用得到的模型預測未來。

機器學習主要領域:

  • 計算機視覺(視頻,圖像處理)
  • 語音識別(聲音處理)
  • 自然語言處理(文本處理)


人工智能、機器學習、深度學習之間的關系?

  • 機器學習是人工智能的一個子類;
  • 深度學習是機器學習的子類;
  • 深度學習是基於傳統的神經網絡算法發展到多隱層的一種算法體現。


機器學習、數據分析、數據挖掘區別與聯系?

  • 數據分析:數據分析是指用適當的統計分析方法對收集的大量數據進行分析,並提取有用的信息,以及形成結論,從而對數據進行詳細的研究和概括過程。在實際工作中,數據分析可幫助人們做出判斷;數據分析一般而言可以分為統計分析、探索性數據分析和驗證性數據分析三大類。
  • 數據挖掘:一般指從大量的數據中通過算法搜索隱藏於其中的信息的過程。通常通過統計、檢索、機器學習、模式匹配等諸多方法來實現這個過程。
  • 機器學習:是數據分析和數據挖掘的一種比較常用、比較好的手段。

機器學習常用框架:

  • Python:sciket-learn() http://scikit-learn.org/stable/
  • Spark(java、scala、Python、R):http://spark.apache.org/
  • TensorFlow
  • Mahout:http://mahout.apache.org/

機器學習概念