1. 程式人生 > >對話浙大博導吳飛:人工智能的前世今生

對話浙大博導吳飛:人工智能的前世今生

腦電波 左移 深深 百度一 運動 產生 就是 演講 全球

自古以來,人類對人工智能就有持久、狂熱的追求,從語音識別到智能音箱,從無人駕駛到人機對戰,人工智能給人類社會帶來了一次又一次的驚喜,被人工智能賦能的各行各業都在煥發新的生機。在人工智能垂直領域商業化繁榮的背後,是基礎層的軟硬件支撐,以及技術層的語音識別/自然語言處理、計算機視覺等應用的漸入佳境。

2018年8月26日,百度為2018人工智能創意賽集訓營邀請了中國高校計算機大賽人工智能創意賽專家委員會主任、浙江大學計算機學院副院長、博士生導師吳飛教授,為你呈現人工智能的前世今生。

技術分享圖片

註:以下為吳飛教授的演講實錄

回溯人工智能的起源

人工智能定義以機器為載體,實現人類智能或生物質能,機器這個載體就是計算平臺,必須思考人工智能所依賴的計算平臺的起因是什麽,什麽東西能實現人類智能或者生物智能,計算這個概念的產生可以回溯到20世紀30年代,當時的人們發現有很多問題是不可以計算的,也有大量的問題是可以計算的。

技術分享圖片
圖一:費馬大定理

比如費馬大定理,希望計算N等於2的時候直角線的平方之和等於斜邊,N等於2的時候存在無窮解。這裏成了數學家的夢魘,經過幾百年的努力,現在已經證明了當N大於等於3的時候,費馬定理不存在解。

這個時候也存在很多不可解的問題,或者需要我們去計算的問題,比如前陣子大家看到很多新聞報道,張教授證明了孿生素數的問題。相差2的素數對,例如3和5,5和7,是否存在無窮多個素數對,存在無窮多個,差小於7000萬的素數對,如果兩個素數之間的差小於7000萬,存在著無窮多素數對,這是一個孿生素數的證明。實際上我們再回看數學歷史三大猜想,第一個是費馬定理,這個通過數學家的努力證明了。第二個四色定理,一張地圖上只需要四種顏色,可以把不相鄰的國家用不同的顏色標明出來,四種顏色足夠多了,這個已經被證明了。最後一個是未得到證明的哥德巴赫猜想。這些問題的原因是什麽,我們講如果證明也是一種計算的過程,是否存在一種計算的裝置,可以把需要我們證明的問題或者計算的問題一步一步的按照機械的方式求解出來。

為了解決這個問題,在20世紀30年代同時產生三種計算平臺,分別概括為原始遞歸函數,圖靈機,這是英國計算機鼻祖圖靈提出的,還有lambda,這三種都是計算平臺,證明三種計算平臺的能力是一樣的,圖靈機能解決的問題,在原始遞歸函數和lambda積分都可以被解決,最終圖靈機成為了計算的平臺,也就成為計算機理論的模型的鼻祖。可以現在定義計算,什麽是可以計算的,圖靈機如果在若幹步驟之後可以停下來給出答案本身,這個問題是可以被計算的,如果圖靈機永遠在計算,永遠給不出答案的本身,不停機,這個問題是不可計算的,也就是圖靈不可停機。

技術分享圖片
圖二:《論數字計算在決斷問題中的應用》

圖靈為了解決這個問題,說什麽是可以計算的,什麽是不可以計算的,在1937年發表一篇文章《論數字計算在決斷問題中的應用》。這篇文章裏圖靈提出了圖靈機的模型。他說任何可以被計算的問題,可以通過這套裝置原則性的像機械裝置一樣一步一步求解。機械裝置有哪些組成部分,一個是兩端無限長的紙帶,上面放上數字和程序指令,有一個控制器,有讀寫頭,讀寫頭每次讀入內容,按照控制器的指令或者對紙帶上的內容讀入,或者左移或者右移,如果有這麽一套裝置,任何可以被計算的問題均可以原則性的被這個裝置所完成。舉一個簡單的例子,比如1+2等於3,圖靈機怎麽完成,1+2被寫進去,圖靈機讀1這個數字,這是一個數字,不做任何操作,向右移動一個紙帶,發現+的符號,圖靈機的控制器說已讀入加法符號,相右尋找被加數,找到之後寫上3,其他數字就被刪除。這個過程把1+2計算出來了。

因此圖靈機現在變成現代計算機的理論模型,現在計算機所有的計算的步驟都是按照圖靈機的理論模型來進行實現的,因此圖靈成為計算機理論鼻祖。為了紀念他,1966年設立了圖靈獎。圖靈一生也是比較短暫的,只在人類的世界上存活了42年。雖然是計算機理論鼻祖,但他的去世是悲劇性的事件。去世的時候床頭留下了一個咬了一口的蘋果,自殺身亡。我們知道蘋果公司的logo也是咬了一口的蘋果,所以都希望蘋果公司出面解釋,為了紀念圖靈而把logo設置成咬了一口的蘋果,但蘋果公司從未對logo作出任何正面的解讀。圖靈的自殺身亡因為受到當時社會的不公正的待遇,英國首相在2009年向圖靈表示深深的歉意。

技術分享圖片
圖三:Enigma

圖靈在二戰期間有一個解碼小組,研制一個密碼破譯器Enigma,它直接破譯了德軍的密碼,將二戰的結束時間提前了三到五年。雖然在人類的歷史長河中圖靈存在的時間非常短暫,但他不僅創造了計算機理論模型,且在實際應用中也做出很大的貢獻。

人工智能學科的誕生

人工智能學科意義上的誕生,是在1955年登上人類歷史舞臺。1955年兩個很年輕的學者和兩個年長的學者他們一起給美國的私人基金會寫了一個項目申請書,項目申請書的題目叫做希望在夏天開展一個研究項目,項目的名字是有關AI。至此,AI這個單詞在1955年8月31日登上了人類的歷史舞臺。他們希望私人基金會資助一筆錢,在1956年的夏天有十幾個學者能開展有關人工智能的研究,研究要讓機器像人那樣認知、思考和學習,即用計算機模擬人的智能。

私人基金會批準這個項目,為了讓這個項目被批準,在報告裏列舉了人工智能值得關註的七個問題,分別叫做自動計算機,計算機編程,神經網絡,計算的復雜性,人工智能算法的智慧學習與提高,歸納與演繹,隨機與創造力。他們認為在1956年這七個問題是讓計算機模擬人的智能活動所必須解決的關鍵問題。那前面四個問題是計算機理論科學正在如火如荼進行研究的問題。國家有863重點研發計劃叫高考機器人,題目叫做基於大數據的內容智能的算法,這個項目下面設九個課題,分別要去參加高考數學,高考語文,高考歷史和高考地理的高考,希望考進前20%的水平。九個課題已經驗收完畢。專家介紹,一旦涉及到這樣的題目,他們稱為自然語言類的題目,高考機器人無能為力。高考機器人只有對公式型的試題表現的能力非常強大,比如三角函數的分解,求某條直線,垂直於另外一個平面,對這樣的公式型的推導問題,高考機器人表現的能力非常強大,但是一旦碰到應用題或者語言類的題目,將無能為力。

舉個簡單的例子,比如雞兔同籠的問題,一個籠子裏面,雞和兔一共有幾條腿,問雞有幾只,兔有幾只。機器人必須知道雞有兩條腿,兔子有四腿。在不知道這些的情況下,高考機器人也無能為力。人工智能提出來之後就邁上了征程,最初的征程是希望完全的替代人類,完全復制人類的大腦,但是從發展的歷史道路來看,我們發現人工智能按照取代人類的部分工作的道路在不斷向前發展,比如用機器來進行定義的證明,去取代解題專家,進行機器的翻譯。大家看到廣告片,百度公司的機器翻譯做的非常好,獲得國家科技進步獎。這是用機器進行語言的翻譯,來替代我們的翻譯工作者,用專家系統,比如面向醫學的專家系統來替代醫生等。

人工智能三種種類:領域人工智能、通用人工智能、增強人工智能

從智能角度對人工智能進行三種不同的分類,第一種稱為領域人工智能,這種人工智能指任務導向,比如像Deep Blue和AlphaGo,計算能力非常強大,計算非常快,數據非常多,因此超越了人類。但這種超越只是在任務上面的超越,比如AlphaGo,戰勝了李世石,戰勝了人類,獲得九段的水平。但是讓AlphaGo做交通的預測,去做其他的工作,他無能為力。因為AlphaGo的成長是依賴於圍棋的大數據,並沒有把交通的大數據輸入給它,因此這種人工智能就是弱人工智能,是在目標比較明確的領域上面超越了人類。第二個通用人工智能或跨領域人工智能,這個只有人類所具有,人類具有很強的舉一反三,從經驗中學習的能力,我們人的大腦並不是靠大數據驅動,或者不完全靠大數據驅動,我們有很強的歸納能力,很強演繹能力,可以把大數據厚積薄發,歸納和演繹的能力非常強大,這是人類通用的人工智能所具有的能力。

技術分享圖片
圖五:混合增強人工智能

第三種是增強人工智能,機器智能有它的長處,人類的智能有它的長處,能不能把人類智能和機器智能進行疊加,形成人機混合的形態,我們叫混合增強人工智能。比如圖五中第三四張圖片達芬奇手術機器人,人類的醫生坐在機器人的後端操作施展復雜的外科手術,如它可以把一個葡萄皮剝開,再縫制成功。這種高超的外科手術可能人類醫生很難完成,但依靠工業級的前端的手術操作手,加上經驗非常豐富的人類醫生進行指揮,就可以把復雜的外科手術完成。
圖五的第二張圖片是巴西世界杯殘障人士,他的腳不能運動,但是科學家們給他裝上一個外骨骼機器人,探索他踢球的腦電波,外骨骼機器人利用腦電波進行提交,就開出巴西世界杯第一個球。本身這個腳已經失去了這個功能,但是有強大的機器和人類的意識形態的混合增強人工智能疊加在一起,就完成了開球的動作。因此長遠來講,今後是人工智能和機器智能緊密的結合在一起,共同完成一些不可能完成的任務,如圖五第一張圖片裏的智慧城市,這個裏面人機物網是相互聯系在一起,各方面的能力進行疊加,就演化成1+1大於2智能行為的系統。這是人工智能的歷史和發展。

人工智能的今生:5G、IOT、芯片

技術分享圖片
圖六:鋼鐵、電力、硬件、軟件、軟/硬協同的歷史發展之路

在美國時間8月2號蘋果公司的股票市值已經突破了一萬億美元的大關,這是整個股票公司市值突破的比較關鍵的歷史關口。我們看到目前有關IT技術為主的美國的公司,在近十年來公司和市值都在不斷的增長, IT公司紛紛像百度一樣把人工智能作為他們的首要的研究的方向,用人工智能來提升他們的產品。我們也看到,在美國的股票市場上面,實際上經歷了幾次門檻的節點,比如圖六中1901年,美國鋼鐵公司股值超過10億美元,通用電氣公司超過100億美元,高股票值的公司從鋼鐵時代到電力時代到硬件時代到軟件時代的邁進,一萬億美元的超越,下一個十萬億美元的公司他們的主打產品可能是什麽,可能像計算服務的公司將是下一個時代可能會將超越十萬美元的公司。

人工智能的生態是怎麽形成的?現在人工智能正往雲網端芯生態逐漸形成,雲就是智能雲,研究很多數據都放在雲端,數據傳送到雲端之後,雲端強大的計算資源把數據處理完畢再返回客戶端,或者終端。我們看到過去幾年,雲計算這個概念在幾大公司正在持續的發力,像亞馬遜、微軟、谷歌、IBM在全球雲計算上面的份額的分布。第二個叫做網,網是涉及到兩方面,一個是5G時代的到來,第二個就是物聯網的深入。5G的時代,從1G、2G、3G到4G,從簡單數據的傳輸到數據的交互能力,以及到5G時代,延時性的下降,可靠的提升,數據傳輸的能力不斷的增強,我們將迎來一個數據的快速的傳輸以及快速的交互,以及安全保障能力的提升,這就是一個網其中的一個方面。

第二個就是物聯網叫做IOT,所有的終端設備將不可避免的因為具有IP地址被融入到大的物聯網的網絡中。預計到2020年,智能設備的總數將超過200億臺,這些設備將非常智能,甚至無需一直連接到雲端,就能具備看、聽、推理和預測的能力。剛才片子裏面講的百度無人車,其實也是強大的終端的計算能力,能實時的識別馬路上的行人,交通端以及任何一種障礙物,快速的作出一些判斷,這些就是端計算的時代的來臨。我們也把它稱為邊緣計算,邊緣計算的特點就是快速反饋,能夠進行安全隱私的保護,能耗比較低。那麽我們現在看到非常多的IT公司,他們在打造他們的雲計算的平臺的時候,也在關心邊緣計算的平臺,像亞馬遜、微軟、百度等,他們紛紛在不停的推出自己的雲計算的平臺的同時,也在著眼邊緣計算的生態的形成。

我們也可以看到現在的深度學習的算法快速的從雲端向邊緣計算的終端進行蔓延,一些更加高效的深度學習的算法,從大量的以計算為主的大型設備上,向以邊端,計算資源不是很豐富的邊緣時代進行邁進。那麽這裏也有一些從學術研究上面,為了加快終端的算法的執行,有些軟件加速和硬件加速的方法,現在被快速提出來,這是邊緣計算的端為主的生態。那麽我們看到我們有雲端計算強大以數據為中心的雲端的強大的計算能力,也有數以萬計的終端設備需要通過高效計算原則,來搭建起來一些邊緣計算的推理能力。

最後一個就是芯片,那麽芯片的發展是以三個不同的階段,比如CPU是通用的芯片,然後出現了矩陣計算為核心的GPU的加速計算芯片的能力,又有半定制的FGPA的芯片,還有全定制的專用芯片的發展,最後就是要模擬人的大腦一樣的神經形態的芯片。現在的芯片的發展,正邁向從通用到專用,從計算到神經形態的邁向的階段。這些神經形態的芯片基本的原則是非常稀疏,人的大腦有60億神經元,並不是每時每刻都在運轉,如果每時每刻進行運轉,人的大腦一天不是20瓦的電力,可能大腦每時每刻都在冒煙,所有神經元都要高度計算,我們需要的電力是非常強大的。所以神經計算的宗旨就是稀疏化的計算。

人工智能生態的形成正在按照從人和人的相連,到人和物的相連,再到物和物的相連,現在正邁向人機物相連的三元空間的時代,這個時代裏面,雲端、網端、終端和AI芯片的人工智能的生態,從最近幾年來看,正在快速的成長和快速的形成。浙江大學建設人工智能的載體,百度、德清和浙江大學一起協辦的高校計算機大賽人工智能創新賽就是其中一個方面,我們還在像高中教材的編寫的工作,以及大學教材的編寫參加人工智能創意賽的比賽。我們想人工智能的生態還是有三個很重要的方面,一個就是要夯實基礎研究以形成創新之源,二是技術交叉以具備創新之力,第三則是面向場景AI以賦能社會所需,總結起來是能力源,這是生態形成過程裏面推進生態形成的比較清晰的思路。

----實錄結束-----

結語:擁抱人工智能,享受智慧生活

人工智能是一門多學科交叉的綜合性前沿學科,理論日趨完善,技術逐漸突破,應用上也在快速擴展和深入生活,可以預見,在算法、基礎設施發展的未來,人工智能的發展和多樣化的生態將會改變所有人的生活。

吳飛
中國高校計算機大賽人工智能創意賽專家委員會主任,浙江大學計算機學院副院長、浙江大學人工智能研究所所長、浙江大學求是特聘教授,博士生導師。主要研究領域為人工智能、跨媒體計算、多媒體分析與檢索和統計學習。視覺感知教育部-微軟重點實驗室(浙江大學)副主任。國家傑出青年基金獲得者(2016年)、教育部新世紀優秀人才支持計劃入選者(2011年度)。

對話浙大博導吳飛:人工智能的前世今生