1. 程式人生 > >基本概念:人工智慧,機器學習,深度學習,強化學習的區別和簡介

基本概念:人工智慧,機器學習,深度學習,強化學習的區別和簡介

人工智慧(Artificial Intelligence)是最早提出的一個專有名詞,早在50多年前就有幾個電腦科學家提出了人工智慧的概念,希望可以製造出可以和人類擁有類似智慧的機器.幾十年來這個概念被不斷的擴散至各行各業.當然也就帶來了各種濫用,一些帶了些許自動化演算法的軟體也被稱為人工智慧.而通常人們心中的人工智慧是美國大片終結者裡面的存在.或者至少是鋼鐵俠盔甲級別的存在才叫人工智慧.而目前業界的真實的人工智慧還處於早期人工智慧階段,或者叫做弱人工智慧,終結者這樣的機器人應該才算強人工智慧.不過目前離這個目標還有些遙遠.人工智慧往往結合著製造業,因此說人工智慧的時候往往會說機器人.筆者目前在西湖大學的實驗中心就是西湖大學人工智慧與機器人中心.將人工智慧結合機械臂,仿生機器人,納米機器人甚至是無人機等均屬於人工智慧與製造業結合的產物.

        機器學習(Machine Learning)是實現人工智慧的一種手段.也是目前被認為比較有效的實現人工智慧的手段.目前在業界使用機器學習比較突出的領域很多,例如計算機視覺,自然語言處理,推薦系統,文字分類等,大家生活中經常用到的比如高速上ETC的車牌識別,蘋果手機上的Siri,看今日頭條時給你推薦的新聞,再比如大家用天貓買東西看評論的時候的評價描述

可以看到通過機器學習的演算法,在8W多條評價中篩選出關鍵詞,紅色的是正面的評價,綠色的是反面的評價,這些都是通過語義分析演算法歸類得出的.機器學習本質上是通過數學演算法來解析資料的規律,學習相關的規律並且用來預測和決策.機器學習主要分為監督學習,無監督學習和半監督學習三種.從演算法上來說有貝葉斯分類,決策樹,線性迴歸,決策樹和隨機森林,主成分分析,流行學習,k-means聚類,高斯混合模型等等.

        深度學習(Deep Learning)是一種機器學習的技術,由於深度學習在現代機器學習中的比重和價值非常巨大,因此常常將深度學習單獨拿出來說.最初的深度學習網路是利用神經網路來解決特徵層分佈的一種學習過程.通常我們瞭解的DNN(深度神經網路),CNN(卷積神經網路),RNN(迴圈神經網路),LSTM(長短期記憶網路)都是隸屬於深度學習的範疇.也是現代機器學習最常用的一些手段.通過這些手段,深度學習在視覺識別,語音識別,自然語言處理(NLP)等領域取得了使用傳統機器學習演算法所無法取得的成就.

        強化學習(Reinforcement Learning),又稱再勵學習或者評價學習.也是機器學習的技術之一.所謂強化學習就是智慧系統從環境到行為對映的學習,以使獎勵訊號(強化訊號)函式值最大,由於外部給出的資訊很少,強化學習系統必須依靠自身的經歷進行自我學習.通過這種學習獲取知識,改進行動方案以適應環境.強化學習最關鍵的三個因素是狀態,行為和環境獎勵.關於強化學習和深度學習的例項,最典型的莫過於谷歌的AlphaGo和AlphaZero兩位了,前者通過深度學習中的深度卷積神經網路,在訓練了大約三千萬組人類的下棋資料,無數度電的情況下才搞出來的模型,而後者使用強化學習的方式,通過自己和自己下棋的方式搞出來的模型.而最終的實驗結果也很讓人震撼.AlphaGo幹敗了人類圍棋頂尖高手,而AlphaZero幹敗了AlphaGo.