1. 程式人生 > >如何理解區分"人工智慧"、“機器學習”、“深度學習”三大巨星

如何理解區分"人工智慧"、“機器學習”、“深度學習”三大巨星

都說教育要從娃娃抓起。學習新東西當然也要從基本概念抓起了,近兩年,人工智慧的真的是火遍大街小巷,不過,“人工智慧”也不是一人獨火,他還有兩個形影不離的隊友:“機器學習”與“深度學習”。這三個詞如同天團組合一般,出現在各種地方,有時甚至互為化身。那麼問題來了,人工智慧、機器學習、深度學習三者到底是什麼關係?它們之間有什麼聯絡與區別呢?

人工智慧——為機器賦予人的智慧

1956年夏天,以麥卡錫(John McCarthy)、明斯基(Marvin Minsky)、羅切斯特(Nathaniel Rochester)和夏農(Claude Shannon)等為首的一批年輕科學家相聚達特茅斯,共同研究和探討用機器模擬智慧的一系列有關問題(史稱“達特茅斯會議”)。在那次會議上,“人工智慧”一詞被提出,也標誌著“人工智慧”這門新興學科的正式誕生。這裡面的科學家我只認識夏農,附上帥照。
夏農本尊


當時的人工智慧研究處於“推理期”,人們認為只要能賦予機器邏輯推理的能力,機器就會具有智慧。當時的研究的確取得了一定的成果,比如證明了不少數學定理,部分定理的證明方式甚至比數學家的更為巧妙。

然而,人類的智慧不僅來源於邏輯推理能力,也來源於大量經驗和知識。比方說假如我從未坐過飛機也從未給別人買過機票,當你問我明天飛北京的機票多少錢,我估計會懵逼,連查攜程都不知道,從而顯得不那麼“智慧”,但其實我的推理能力並沒有掉線。從20世紀70年代開始,人工智慧研究進入了“知識期”,人們希望在推理的基礎上,把各領域的知識總結起來告訴機器,讓它獲得智慧。當時大量的專家系統(具有大量的專門知識與經驗的程式系統,可進行推理和判斷,模擬人類專家的決策過程)問世,在很多應用領域取得了不少成果。

但人們很快認識到,把知識總結起來教給機器是非常困難的(稱為“知識工程瓶頸”),因為人類的知識實在太多,還得把這些知識寫成機器能夠理解的形式。如果我們能夠只給機器一些相對原始的資料,然後讓機器自己去進行學習,那該多好。所以從20世紀80年代開始,機器學習這一技術路線逐漸主導了人工智慧的研究,直到現在。

機器學習—— 一種實現人工智慧的方法

機器學習可以理解為機器從已知的經驗資料(樣本)中,通過某種特定的方法(演算法),自己去尋找提煉(訓練/學習)出一些規律(模型);提煉出的規律就可以用來判斷一些未知的事情(預測)。

機器學習最基本的做法,是使用演算法來解析資料、從中學習,然後對真實世界中的事件做出決策和預測。與傳統的為解決特定任務、硬編碼的軟體程式不同,機器學習是用大量的資料來“訓練”,通過各種演算法從資料中學習如何完成任務。

比如我們接觸了1w只單身汪(已知樣本),通過歸納總結與比較(演算法)找出TA們身上一些共性特點,然後將這些共性特點作為判斷單身汪的依據(模型),那麼下次遇到一個人(未知樣本),就可以判斷TA是不是單身了(預測)。

既然是從一堆已知的樣本中找規律,那麼找規律的方式以及找出的規律的形態就會因人而異,也就是演算法與模型都可能會有所不同。所以,機器學習本身也是分為不同流派的,每種流派都有它代表性的模型與演算法。機器學習主要分為符號主義學習(以決策樹模型與相關演算法為代表)、連線主義學習(以神經網路模型與相關演算法為代表)與統計學習(以支援向量機與相關演算法為代表)。符號主義學習與連線主義學習在20世紀80年代至90年代中期非常流行,統計學習則從90年代中期開始迅速佔據舞臺。值得一提的是,為判斷一個人是否為單身汪而找出的一系列特徵規律其實就是一棵決策樹。

任何通過資料訓練的學習演算法的相關研究都屬於機器學習,包括很多已經發展多年的技術,比如線性迴歸(Linear Regression)、K均值(K-means,基於原型的目標函式聚類方法)、決策樹(Decision Trees,運用概率分析的一種圖解法)、隨機森林(Random Forest,運用概率分析的一種圖解法)、PCA(Principal Component Analysis,主成分分析)、SVM(Support Vector Machine,支援向量機)以及ANN(Artificial Neural Networks,人工神經網路)。

深度學習——一種實現機器學習的技術

進入21世紀之後,網際網路與移動網際網路的興起造成了資料量的爆發式增長,雲端計算也使得計算能力大幅增強,同時神經網路的相關演算法也逐漸成熟,所以導致連線主義的代表——神經網路捲土重來。再次歸來的神經網路,往往擁有比原先更為龐大的網路層級結構,所以被稱為“深度神經網路”。由於有足夠的訓練資料和計算能力,深度神經網路在很多(尤其是語音處理、自然語言處理、影象處理等較為複雜的)任務中取得了非常優異的效能。效能的突破促成了人工智慧在語音識別、文字翻譯、人臉識別等一系列場景的應用,讓大家看到了新技術落地所帶來的經濟效益與想象空間,從而引起了人工智慧的熱潮。

說了這麼多,下面用一幅圖來說明人工智慧的技術流派類別與演變歷程。要注意的是,雖然人工智慧的流派在不斷演變,但這並非說明過去的技術路線就被拋棄了。這更像是以實際應用為導向的各領風騷——在一個時代,某種技術流派正好能夠較好地解決這個時代所需要去解決的實際產業問題,那麼自然就會流行。目前有很多不同的機器學習技術正應用於各自適合的場景,比如作為統計學習代表的支援向量機,仍然是文字分類任務的首選技術。

三大巨星的成長史

發展歷史

故事的結尾

人工智慧是一個大的概念,是研究如何使機器獲得智慧的學科;機器學習是人工智慧中的一個技術流派,通過從已知樣本中提煉規律來獲得判斷未知樣本的“智慧”;深度學習則是機器學習的一種,它所學習出來的模型是深度神經網路。深度學習使得機器學習能夠實現眾多的應用,並拓展了人工智慧的領域範圍。
這裡寫圖片描述