1. 程式人生 > >一篇文章講清楚人工智慧、機器學習和深度學習的區別和聯絡

一篇文章講清楚人工智慧、機器學習和深度學習的區別和聯絡

人工智慧的浪潮正在席捲全球,諸多詞彙時刻縈繞在我們耳邊:人工智慧(Artificial Intelligence)、機器學習(Machine Learning)、深度學習(Deep Learning)。不少人對這些高頻詞彙的含義及其背後的關係總是似懂非懂、一知半解。

為了幫助大家更好地理解人工智慧,這篇文章用最簡單的語言解釋了這些詞彙的含義,理清它們之間的關係,希望對剛入門的同行有所幫助。

人工智慧:從概念提出到走向繁榮

1956年,幾個電腦科學家相聚在達特茅斯會議,提出了“人工智慧”的概念,夢想著用當時剛剛出現的計算機來構造複雜的、擁有與人類智慧同樣本質特性的機器。其後,人工智慧就一直縈繞於人們的腦海之中,並在科研實驗室中慢慢孵化。之後的幾十年,人工智慧一直在兩極反轉,或被稱作人類文明耀眼未來的預言,或被當成技術瘋子的狂想扔到垃圾堆裡。直到2012年之前,這兩種聲音還在同時存在。


2012年以後,得益於資料量的上漲、運算力的提升和機器學習新演算法(深度學習)的出現,人工智慧開始大爆發。據領英近日釋出的《全球AI領域人才報告》顯示,截至2017年一季度,基於領英平臺的全球AI(人工智慧)領域技術人才數量超過190萬,僅國內人工智慧人才缺口達到500多萬。

人工智慧的研究領域也在不斷擴大,圖一展示了人工智慧研究的各個分支,包括專家系統、機器學習、進化計算、模糊邏輯、計算機視覺、自然語言處理、推薦系統等。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

圖一 人工智慧研究分支

但目前的科研工作都集中在弱人工智慧這部分,並很有希望在近期取得重大突破,電影裡的人工智慧多半都是在描繪強人工智慧,而這部分在目前的現實世界裡難以真正實現(通常將人工智慧分為弱人工智慧和強人工智慧,前者讓機器具備觀察和感知的能力,可以做到一定程度的理解和推理,而強人工智慧讓機器獲得自適應能力,解決一些之前沒有遇到過的問題)。

弱人工智慧有希望取得突破,是如何實現的,“智慧”又從何而來呢?這主要歸功於一種實現人工智慧的方法——機器學習。

機器學習:一種實現人工智慧的方法

機器學習最基本的做法,是使用演算法來解析資料、從中學習,然後對真實世界中的事件做出決策和預測。與傳統的為解決特定任務、硬編碼的軟體程式不同,機器學習是用大量的資料來“訓練”,通過各種演算法從資料中學習如何完成任務。

舉個簡單的例子,當我們瀏覽網上商城時,經常會出現商品推薦的資訊。這是商城根據你往期的購物記錄和冗長的收藏清單,識別出這其中哪些是你真正感興趣,並且願意購買的產品。這樣的決策模型,可以幫助商城為客戶提供建議並鼓勵產品消費。

機器學習直接來源於早期的人工智慧領域,傳統的演算法包括決策樹、聚類、貝葉斯分類、支援向量機、EM、Adaboost等等。從學習方法上來分,機器學習演算法可以分為監督學習(如分類問題)、無監督學習(如聚類問題)、半監督學習、整合學習、深度學習和強化學習。

傳統的機器學習演算法在指紋識別、基於Haar的人臉檢測、基於HoG特徵的物體檢測等領域的應用基本達到了商業化的要求或者特定場景的商業化水平,但每前進一步都異常艱難,直到深度學習演算法的出現。

深度學習:一種實現機器學習的技術

深度學習本來並不是一種獨立的學習方法,其本身也會用到有監督和無監督的學習方法來訓練深度神經網路。但由於近幾年該領域發展迅猛,一些特有的學習手段相繼被提出(如殘差網路),因此越來越多的人將其單獨看作一種學習的方法。

最初的深度學習是利用深度神經網路來解決特徵表達的一種學習過程。深度神經網路本身並不是一個全新的概念,可大致理解為包含多個隱含層的神經網路結構。為了提高深層神經網路的訓練效果,人們對神經元的連線方法和啟用函式等方面做出相應的調整。其實有不少想法早年間也曾有過,但由於當時訓練資料量不足、計算能力落後,因此最終的效果不盡如人意。

深度學習摧枯拉朽般地實現了各種任務,使得似乎所有的機器輔助功能都變為可能。無人駕駛汽車,預防性醫療保健,甚至是更好的電影推薦,都近在眼前,或者即將實現。其原因與以下因素息息相關:

首先,深度卷積神經網路需要大量資料進行訓練。網路深度太淺的話,識別能力往往不如一般的淺層模型,比如SVM或者boosting;如果做得很深,就需要大量資料進行訓練,否則機器學習中的過擬合將不可避免。而2006年開始,正好是網際網路開始大量產生各種各樣的圖片資料的時候,即視覺大資料開始爆發式地增長。

其次,是運算能力。卷積神經網路對計算機的運算要求比較高,需要大量重複可並行化的計算,在當時CPU只有單核且運算能力比較低的情況下,不可能進行很深的卷積神經網路的訓練。隨著GPU計算能力的增長,卷積神經網路結合大資料的訓練才成為可能。

最後,就是人和。卷積神經網路有一批一直在堅持的科學家(如Lecun)才沒有被沉默,才沒有被海量的淺層方法淹沒。最後終於看到卷積神經網路佔領主流的曙光。

有一點需要特別提醒的是,或許,深度學習更值得我們借鑑的是“深度”這一思想,但它是否等同於深度神經網路,學者們的意見並非一致。比如,南京大學的周志華(西瓜書作者)提出了gcForest(多粒度級聯森林),在接受採訪時,周志華老師認為,解決複雜問題把模型變深可能是有必要的,但是深度學習應該不只是深度神經網路,還可以有其他形式,與神經網路相比,其他形式也許有更好的性質。這段話或許會給我們深刻的警示。

三者的區別和聯絡

機器學習是一種實現人工智慧的方法,深度學習是一種實現機器學習的技術。我們就用最簡單的方法——同心圓,視覺化地展現出它們三者的關係。

640?wx_fmt=jpeg

圖二 三者關係示意圖

當下的人工智慧時代,機器學習的重要性不言而喻,為此,中科院自動化所科研一線青年教師,推出《機器學習:從理論到實踐》、《深度學習:從理論到實踐》兩門線上直播課程。課程體系設定充分結合理論與實踐,PPT以及程式碼均會提供給學員,併為學員搭建跟老師微信群即時交流的平臺。

機器學習課程內容

1. 數學基礎(PPT資料)

1.1 矩陣論、概率論、優化基礎知識

2. 機器學習演算法:從理論到實踐(20學時)

2.1 機器學習概述

      2.1.1 機器學習方法分類

      2.1.2 基礎知識介紹

2.2 KNN演算法

      2.2.1 概述與理論詳解

      2.2.2 K近鄰應用案例及程式碼實現

2.1 機器學習概述

      2.1.1 機器學習方法分類

      2.1.2 基礎知識介紹

2.2 KNN演算法

      2.2.1 概述與理論詳解

      2.2.2 K近鄰應用案例及程式碼實現

2.3 貝葉斯分類

      2.3.1 樸素貝葉斯

      2.3.2 貝葉斯決策論

      2.3.3 NB分類演算法應用案例及程式碼實現

2.4 迴歸與分類

      2.4.1 曲線擬合

      2.4.2 線性迴歸

      2.4.3 logistic迴歸

      2.4.4 相關應用案例及程式碼實現

2.5 支援向量機

      2.5.1 線性支援向量機

      2.5.2 非線性支援向量機

      2.5.3 核方法

      2.5.4 SVM應用案例及程式碼實現

2.6 聚類演算法

      2.6.1 K均值聚類

      2.6.2 層次聚類

      2.6.3 聚類演算法應用案例及程式碼實現

2.7 資料降維

      2.7.1 線性降維

      2.7.2 非線性降維

      2.7.3 降維應用案例及程式碼實現

2.8 EM演算法

      2.8.1 EM演算法基礎

      2.8.2 多高斯引數估計

      2.8.3 EM應用案例及程式碼實現

2.9 Adaboost演算法

      2.9.1 獨立於演算法的機器學習

      2.9.2 Adaboost演算法

      2.9.3 應用案例及程式碼實現

2.10 隱馬爾科夫模型

      2.10.1 馬爾科夫

      2.10.2 隱馬爾科夫模型

      2.10.3 應用案例及程式碼實現

深度學習課程內容

1. 數學基礎(PPT資料)

1.1 貝葉斯決策理論、引數與非引數估計

1.2 迴歸與分類

1.3 梯度下降優化

1.4 資訊熵

2. 深度學習理論(6學時)

2.1 前饋神經網路(概述、單層神經網路、多層神經網路)

2.2 卷積神經網路(基本概念、發展歷程、網路特點、網路設定、網路訓練以及相關應用)

2.3 反饋神經網路(Hopfield網路、玻爾茲曼機、受限玻爾茲曼機)

3. 深度網路常見模型與Keras實戰(8學時)

3.1 Keras與殘差網路(從LSTM到Highway網路、從Highway網路到殘差網路、基於Highway網路的應用)

3.2 自動編碼機AE及生成對抗網路GAN(AE的起源與變種、生成對抗網路GAN、基於GAN網路的應用)

3.3 基於Keras的行為識別(行為識別問題簡介、基於深度學習的行為識別常用模型介紹、基於Keras的行為識別實踐)

3.4 基於Keras的場景分割(場景分割問題簡介、基於深度學習的場景分割常用模型介紹、基於Keras的場景分割實踐)

4. 深度學習框架(4學時)

4.1 Caffe入門(簡介、安裝和配置、優點與侷限性分析、深入Caffe原始碼、Caffe除錯)

4.2 Caffe提高(基於Caffe的MINST手寫識別、Caffe的Python介面、Caffe修改與新增Layer、網路訓練技巧)

講師團隊

汪老師,中科院自動化所一線科研學者,副研究員,在領域頂級會議期刊 ICCV、TNNLS、TIP等發表論文20多篇;參加全國視訊影象分析技術挑戰賽,獲得目標檢測識別第二名,熟練掌握並應用深度學習Keras框架和Caffe框架。

宮老師某知名外企研究院演算法工程師,中國科學院自動化研究所博士畢業生,在計算機視覺與人工智慧領域具有近六年的研究經歷。攻讀博士學位期間主要研究方向是模式識別與影象處理,曾在模式識別領域內頂級國際期刊發表論文,參加某知名網際網路公司舉辦的影象分割競賽,獲得第四名的成績。目前主要負責計算機視覺與人工智慧方面的演算法研發工作。

邵老師現任副教授、碩士生導師,中科院自動化所博士畢業,具有兩年教學授課經驗。主要研究方向包括機器學習、模式識別與影象處理,作為專案負責人承擔國家自然科學基金,在國際主流期刊和會議上發表論文數篇。

霍老師,一線青年學者,西安電子科技大學博士畢業,研究方向為影象處理,主持和參與多項國家自然科學基金,以第一作者在相關領域期刊以及會議上發表論文多篇。

課程價格及優惠

機器學習、深度學習課程分別限報 300人,報滿為止。

機器學習課程價格為 499元,前 100 名報名者,直接優惠 100 元,僅剩 50 個名額!深度學習課程價格為 499元。

報名者均可領取 1200G 人工智慧資料,資料內容包含資料集、演算法文件資料和視訊資料。

640?wx_fmt=png

640?wx_fmt=png

開課時間及形式

1.機器學習課程:11月30日-12月21日每週四、六、日晚7點-9點,線上直播授課

2. 深度學習課程:10月29日-11月26日每週六、日晚7點-9點,線上直播授課;

3. 課程一年內可實時檢視視訊回放;

4. 課程PPT和源程式,會提前公開給學員;

5. 課前、課中和課後,微信群均可答疑。

請新增助教微信領取優惠券

640?wx_fmt=jpeg