1. 程式人生 > >人工智慧、機器學習和深度學習的區別和聯絡

人工智慧、機器學習和深度學習的區別和聯絡

(轉自 深藍學院 大資料探勘DT資料分析)

人工智慧的浪潮正在席捲全球,諸多詞彙時刻縈繞在我們耳邊:人工智慧(Artificial Intelligence)、機器學習(Machine Learning)、深度學習(Deep Learning)。不少人對這些高頻詞彙的含義及其背後的關係總是似懂非懂、一知半解。

為了幫助大家更好地理解人工智慧,這篇文章用最簡單的語言解釋了這些詞彙的含義,理清它們之間的關係,希望對剛入門的同行有所幫助。

一、人工智慧:從概念提出到走向繁榮

1956年,幾個電腦科學家相聚在達特茅斯會議,提出了“人工智慧”的概念,夢想著用當時剛剛出現的計算機來構造複雜的、擁有與人類智慧同樣本質特性的機器。其後,人工智慧就一直縈繞於人們的腦海之中,並在科研實驗室中慢慢孵化。之後的幾十年,人工智慧一直在兩極反轉,或被稱作人類文明耀眼未來的預言,或被當成技術瘋子的狂想扔到垃圾堆裡。直到2012年之前,這兩種聲音還在同時存在。

2012年以後,得益於資料量的上漲、運算力的提升和機器學習新演算法(深度學習)的出現,人工智慧開始大爆發。據領英近日釋出的《全球AI領域人才報告》顯示,截至2017年一季度,基於領英平臺的全球AI(人工智慧)領域技術人才數量超過190萬,僅國內人工智慧人才缺口達到500多萬。

人工智慧的研究領域也在不斷擴大,圖一展示了人工智慧研究的各個分支,包括專家系統、機器學習、進化計算、模糊邏輯、計算機視覺、自然語言處理、推薦系統等。

這裡寫圖片描述

但目前的科研工作都集中在弱人工智慧這部分,並很有希望在近期取得重大突破,電影裡的人工智慧多半都是在描繪強人工智慧,而這部分在目前的現實世界裡難以真正實現(通常將人工智慧分為弱人工智慧和強人工智慧,前者讓機器具備觀察和感知的能力,可以做到一定程度的理解和推理,而強人工智慧讓機器獲得自適應能力,解決一些之前沒有遇到過的問題)。

弱人工智慧有希望取得突破,是如何實現的,“智慧”又從何而來呢?這主要歸功於一種實現人工智慧的方法——機器學習。

二、機器學習:一種實現人工智慧的方法

機器學習最基本的做法,是使用演算法來解析資料、從中學習,然後對真實世界中的事件做出決策和預測。與傳統的為解決特定任務、硬編碼的軟體程式不同,機器學習是用大量的資料來“訓練”,通過各種演算法從資料中學習如何完成任務。

舉個簡單的例子,當我們瀏覽網上商城時,經常會出現商品推薦的資訊。這是商城根據你往期的購物記錄和冗長的收藏清單,識別出這其中哪些是你真正感興趣,並且願意購買的產品。這樣的決策模型,可以幫助商城為客戶提供建議並鼓勵產品消費。

機器學習直接來源於早期的人工智慧領域,傳統的演算法包括決策樹、聚類、貝葉斯分類、支援向量機、EM、Adaboost等等。從學習方法上來分,機器學習演算法可以分為監督學習(如分類問題)、無監督學習(如聚類問題)、半監督學習、整合學習、深度學習和強化學習。

傳統的機器學習演算法在指紋識別、基於Haar的人臉檢測、基於HoG特徵的物體檢測等領域的應用基本達到了商業化的要求或者特定場景的商業化水平,但每前進一步都異常艱難,直到深度學習演算法的出現。

三、深度學習:一種實現機器學習的技術

深度學習本來並不是一種獨立的學習方法,其本身也會用到有監督和無監督的學習方法來訓練深度神經網路。但由於近幾年該領域發展迅猛,一些特有的學習手段相繼被提出(如殘差網路),因此越來越多的人將其單獨看作一種學習的方法。
最初的深度學習是利用深度神經網路來解決特徵表達的一種學習過程。深度神經網路本身並不是一個全新的概念,可大致理解為包含多個隱含層的神經網路結構。為了提高深層神經網路的訓練效果,人們對神經元的連線方法和啟用函式等方面做出相應的調整。其實有不少想法早年間也曾有過,但由於當時訓練資料量不足、計算能力落後,因此最終的效果不盡如人意。

深度學習摧枯拉朽般地實現了各種任務,使得似乎所有的機器輔助功能都變為可能。無人駕駛汽車,預防性醫療保健,甚至是更好的電影推薦,都近在眼前,或者即將實現。其原因與以下因素息息相關:
首先,深度卷積神經網路需要大量資料進行訓練。網路深度太淺的話,識別能力往往不如一般的淺層模型,比如SVM或者boosting;如果做得很深,就需要大量資料進行訓練,否則機器學習中的過擬合將不可避免。而2006年開始,正好是網際網路開始大量產生各種各樣的圖片資料的時候,即視覺大資料開始爆發式地增長。
其次,是運算能力。卷積神經網路對計算機的運算要求比較高,需要大量重複可並行化的計算,在當時CPU只有單核且運算能力比較低的情況下,不可能進行很深的卷積神經網路的訓練。隨著GPU計算能力的增長,卷積神經網路結合大資料的訓練才成為可能。
最後,就是人和。卷積神經網路有一批一直在堅持的科學家(如Lecun)才沒有被沉默,才沒有被海量的淺層方法淹沒。最後終於看到卷積神經網路佔領主流的曙光。

有一點需要特別提醒的是,或許,深度學習更值得我們借鑑的是“深度”這一思想,但它是否等同於深度神經網路,學者們的意見並非一致。比如,南京大學的周志華(西瓜書作者)提出了gcForest(多粒度級聯森林),在接受採訪時,周志華老師認為,解決複雜問題把模型變深可能是有必要的,但是深度學習應該不只是深度神經網路,還可以有其他形式,與神經網路相比,其他形式也許有更好的性質。這段話或許會給我們深刻的警示。

三者的區別和聯絡

機器學習是一種實現人工智慧的方法,深度學習是一種實現機器學習的技術。我們就用最簡單的方法——同心圓,視覺化地展現出它們三者的關係。

圖二 三者關係示意圖