1. 程式人生 > >機器學習入門:概念原理及常用演算法

機器學習入門:概念原理及常用演算法

機器學習(Machine Learning, ML)是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、演算法複雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能。 它是人工智慧的核心,是使計算機具有智慧的根本途徑,其應用遍及人工智慧的各個領域,它主要使用歸納、綜合而不是演繹。

本課程主要講解機器學習的概念、原理和應用場景,以及機器學習的常用演算法,比如有監督學習、無監督學習、線性迴歸等。

意義:

學習是人類具有的一種重要智慧行為,但究竟什麼是學習,長期以來卻眾說紛紜。社會學家、邏輯學家和心理學家都各有其不同的看法。   比如,Langley(1996) 定義的機器學習是“機器學習是一門人工智慧的科學,該領域的主要研究物件是人工智慧,特別是如何在經驗學習中改善具體演算法的效能”。(Machine learning is a science of the artificial. The field's main objects of study are artifacts, specifically algorithms that improve their performance with experience.')   Tom Mitchell的機器學習(1997)對資訊理論中的一些概念有詳細的解釋,其中定義機器學習時提到,“機器學習是對能通過經驗自動改進的計算機演算法的研究”。(Machine Learning is the study of computer algorithms that improve automatically through experience.)   Alpaydin(2004)同時提出自己對機器學習的定義,“機器學習是用資料或以往的經驗,以此優化計算機程式的效能標準。”(Machine learning is programming computers to optimize a performance criterion using example data or past experience.)   儘管如此,為了便於進行討論和估計學科的進展,有必要對機器學習給出定義,即使這種定義是不完全的和不充分的。顧名思義, 機器學習是研究如何使用機器來模擬人類學習活動的一門學科。稍為嚴格的提法是:機器學習是一門研究機器獲取新知識和新技能,並識別現有知識的學問。這裡所說的“機器”,指的就是計算機,電子計算機,中子計算機、光子計算機或神經計算機等等。   機器能否象人類一樣能具有學習能力呢?1959年美國的塞繆爾(Samuel)設計了一個下棋程式,這個程式具有學習能力,它可以在不斷的對弈中改善自己的棋藝。4年後,這個程式戰勝了設計者本人。又過了3年,這個程式戰勝了美國一個保持8年之久的常勝不敗的冠軍。這個程式向人們展示了機器學習的能力,提出了許多令人深思的社會問題與哲學問題。   機器的能力是否能超過人的,很多持否定意見的人的一個主要論據是:機器是人造的,其效能和動作完全是由設計者規定的,因此無論如何其能力也不會超過設計者本人。這種意見對不具備學習能力的機器來說的確是對的,可是對具備學習能力的機器就值得考慮了,因為這種機器的能力在應用中不斷地提高,過一段時間之後,設計者本人也不知它的能力到了何種水平。   機器學習有下面幾種定義: “機器學習是一門人工智慧的科學,該領域的主要研究物件是人工智慧,特別是如何在經驗學習中改善具體演算法的效能”。 “機器學習是對能通過經驗自動改進的計算機演算法的研究”。 “機器學習是用資料或以往的經驗,以此優化計算機程式的效能標準。” 一種經常引用的英文定義是:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.   機器學習已經有了十分廣泛的應用,例如:資料探勘、計算機視覺、自然語言處理、生物特徵識別、搜尋引擎、醫學診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、戰略遊戲和機器人運用。

講師介紹:

西亭,螞蟻金服大規模機器學習高階演算法專家

課程目標:

  •  掌握機器學習的概念、原理和演算法

適合人群:

  •  大資料開發者

更多精品課程: