初窺AI版“未來簡史”
“人工智慧和生物基因技術正在重塑世界,計算機和大資料將比我們自己更瞭解自己。”在2017年度“大眾喜愛的50種圖書”中,尤瓦爾·赫拉利的《未來簡史》榜上有名,這本書以巨集大的視角審視人類未來的終極命運:人類,正一步步進化為神一般的存在,開始複製自身,創造新的智慧生命體。
人工智慧是全球競爭的新焦點,而中國成為AI大秀的舞臺。2018世界人工智慧大會(WAIC)上,最新AI應用紛紛亮相,來自世界各地的學者、產業精英共同探討AI產業發展,《未來簡史》中未來人類與AI的變化,從這裡可以一窺端倪。
AI什麼時候能進入2.0?AI下一代技術是什麼?AI能和哪些行業結合共同探索世界?
人類的未來已來,AI的未來尚需等待。
演算法2.0
下一個“深度學習”是誰?
半個世紀以前,麻省理工學院幾個計算機系的教授第一次提到人工智慧這個詞時,他們以為人工智慧是一個夏天就能解決的問題,但直到現在人工智慧還是實驗科學。2016年AlphaGo對弈讓普通人意識到人工智慧的魅力,其採用的深度學習方式在影象識別和語音識別領域的成功,讓它幾乎成為AI的代名詞,短短兩年,人工智慧技術已經應用到自動駕駛、機器人、醫療診斷等多個領域,深度學習成為人工智慧熱潮的主力軍。
然而,深度學習的缺點也很明顯:對資料和算力要求高,而最終機器給出的結論是“黑盒子”,人們只能知其然卻不知其所以然。
“大概五六年以後,深度學習的演算法可能會到達增長極限。下一波AI創新應該來自哪裡?”圖靈獎獲得者、清華大學交叉資訊研究院院長姚期智在本次WAIC大會上提出了“姚之問”。
如何回答“姚之問”?
深度學習的“高門檻”
“能夠引領AI發展的頂級人才,環顧全球尚不足千人,這讓AI成為供不應求的搶手貨,只有AI的應用門檻降低到普通開發者甚至是業務人員也能做的程度,才能夠真正爆發。”第四正規化的創始人戴文淵在WAIC上表示,據《全球人工智慧人才白皮書》資料統計,目前全世界只有不超過 1000 家公司擁有能夠開發 AI 系統的人才,與此同時,更多公司卻擁有開發 AI 系統所需的資料。
屢屢在國際語音識別大賽中奪魁的科大訊飛,對深度學習的優劣也深有體會,其董事長劉慶峰在WAIC的不同論壇上多次表示,“深度神經網路學習面臨著演算法突破的挑戰,比如目前資料引數的設定都是手動,很多優秀的碩士、博士生只能將時間耗費在這種機械操作上,其次,深度學習對樣本需求量過大,能否有少量資料就可以學習,而且目前深度學習很難突破有監督訓練,未來能否變成半監督或者無監督訓練?”
劉慶峰指出的正是兩個深度神經網路學習最難和最耗時的問題:處理資料格式化和培養深度學習模型,而這兩個難題在某種程度上阻礙了AI的普及,因為資料、算力、建模都需要耗費大量人力和資本,普通企業根本無力“AI化”,而這恰恰也是斯坦福教授李飛飛希望倡導“AI民主化”的緣由。
演算法突破
AutoML實現“AI的民主”
從學界來看,遷移學習、冷撲大師、膠囊網路等等新的演算法都有可能在接下來的幾年中實現突破,但目前最早進入商業化、並且已經相對成熟的是基於遷移學習的AutoML。
可以讓機器自動建模、自動調參的AutoML被李飛飛稱為“AI民主化的重要進展”,因為它大大降低了AI使用者的門檻,每個人都可以利用AI技術自動生成AI應用,將企業的資料自動變為模型,整個機器學習過程是自動化的。
戴文淵以及第四正規化的聯合創始人、香港科技大學計算機系主任楊強都是遷移學習領域全球排名前三的科學家。
戴文淵告訴《IT時報》記者,儘管在AutoML領域,微軟和谷歌都在2017年釋出了相關產品,但中國AI公司在這方面毫不遜色,前不久,國際人工智慧頂尖學術會議NIPS正式宣佈,第四正規化擊敗了谷歌獲得AutoML Challenge(挑戰)2018 大賽的承辦權。
國產“AI作業系統”時機成熟
戴文淵將第四正規化的AI Prophet AutoML(以下簡稱“AutoML平臺”)定義為“AI的AI”,開發者無需深入理解演算法原理和完成大量編碼訓練,只需做到“收集行為資料、收集反饋資料、模型訓練、模型應用”四步,便可以直接升級為AI開發者,這樣一個公司AI應用的開發週期從以半年為單位縮短至周級別。
或許將之比喻為“AI中的Windows”更容易理解,一家中小企業不需要去自己做一套Windows,而是在Windows上開啟Office輸入資料便可以得到自己想要的答案。但對於科技創新而言,從0到1的路走得最難,軟體時代,中國國產作業系統半途折戟,AI時代,中國能有自己的AI“作業系統”嗎?
“作業系統能否成功,核心不在技術而是應用,軟體時代,所有的應用軟體也都來自國外,國產作業系統根本無力與Windows競爭,而AI時代,全球應用需求的中心在中國,我認為,國產AI作業系統的市場時機已經成熟。”戴文淵表示。
下一代人工智慧要有推理能力
為什麼研究人工智慧?基礎科學不太接地氣,澳大利亞科學院院士陶大程試圖用更形象的語言讓大家理解,他拿出一張畫面滿是人的照片問:誰知道照片中有多少人?會場近千名觀眾無人作答,有人下意識的開始去數,但通過人工智慧技術,照片很快顯示出答案,3秒中檢測出920張人臉。
“除了圖片,現在的技術也能對視訊中的人物做人臉檢測、特徵點檢測,識別人與鏡頭的距離,甚至把視訊的背景檢測出來改成油畫和中國畫。人類通過眼睛看見這個世界,對周圍的事物有迅速的判斷和認知,如今我們做的是教機器如何變得像人類一樣聰明。”陶大程的主要研究方向是表徵學習,這也是人工智慧領域非常重要的研究方向之一,包括多視角學習、多標籤學習、多工學習、遷移學習、張量學習、噪聲資料學習等,這些研究成果被應用於計算機視覺、影象處理以及生物識別技術等領域。
人工智慧技術在向前行進過程中,總是遇到不同的問題,機器學習也像“盲人摸象”,看到某一部分,在已有信息的條件下做出最好的決策。“我們研究多視角學習,通過多個感測器拍攝同一個物體的不同狀態,再彙總到一個平臺做出選擇。就像無人駕駛,有鐳射雷達、獲取視覺資料的攝像機,獲取聽覺資料的麥克風陣列等非常多的感測器,之後把感測器資訊最終結合起來做出判斷。未來,能不能有一個上帝視角,讓機器知道自己看到的是一個物體的不同角度?”陶大程希望通過多視角學習來改善這一問題,把一些不同源、不同表達方式的資訊整合起來,以改善後續的識別問題。
對於下一代人工智慧具有什麼特徵,陶大程同樣用一張圖片舉例,通過圖片人物的著裝和神情,人類一眼即可判別圖片中的人在看球賽,“機器是能做到,但需要收集大量的資訊才能教會它判斷,這樣的人工智慧是我們需要的嗎?不是!下一代的人工智慧應該有推理能力,也只能是推理的時代。”
算力2.0
無限向人腦靠近
對於AI的未來,調整演算法固然可以減少對資料量和算力的需求,但根本而言,AI仍然是一個需要大算力的技術,尤其在生物、氣象等大自然領域,海量的資料依然要靠大型超算夜以繼日地運算,而量子計算和AI的結合,則很可能讓算力呈現爆發式增長。
量子人工智慧將真正認知自然
2000年,因為對計算理論的貢獻,姚期智被授予圖靈獎,而他的回國填補了國內計算機學科的空白。在這位年過古稀的老科學家眼中,量子物理是最美麗的物理法則,如果有一個足夠強大的量子計算機,也許有可能模仿大自然量子法則,從而理解自然智慧。當人工智慧與量子計算機結合,人們對世界甚至宇宙的探索會有更加深刻的認識, “深度學習的發展給了科學家一個如何看待電腦科學的新角度,是不是可以將量子計算和人工智慧結合,進行量子人工智慧,量子計算本身就能擴大了人類獲得知識、認知宇宙的能力,也許通過兩者的結合,人類可以真正有機會‘攻克’自然界。”
姚期智把著眼點放在量子人工智慧不難理解,量子計算是他上世紀90年代開始主攻的研究領域。
拋去多粒子糾纏、量子位元、多量子系統等晦澀難懂的名詞,具有超快的平行計算和模擬能力的量子計算機令人興奮。量子計算機的計算能力有多強?有人打了個比方:如果將現在的計算機速度比作自行車,那麼量子計算機的速度就是飛機。
人工智慧可與多學科結合
量子計算機什麼時候出現?何時能與人工智慧相結合?對於看好這一產業的人來說,這是必須要思考的問題。迄今為止,科學家們還並沒有對開發量子計算機的最佳方法達成一致。面對場景多元化的人工智慧,其他學科已經率先與之結合。
“人工智慧剛剛開始,需要做的不只是把機器的計算能力再提升,還有許多科學問題亟待突破,要把心胸放大,深度學習需要和很多學科結合在一起,數學、計算機、神經科學等等。”姚期智說。
值得注意的是,學術界已經注意到交叉學科為人工智慧發展帶來的更多可能性,開始匯聚計算機、統計、心理學、人文社科等領域的力量與人工智慧相結合。比如,通訊和計算機的交叉學科雲端計算,把雲端計算的運作模式與人工智慧深入融合,可以把龐大的人工智慧執行成本轉移到雲平臺,從而降低終端裝置使用人工智慧技術的門檻。另外,神經科學提供的神經網路模型,對人工智慧的發展也頗有貢獻,2018世界人工智慧大會的學者不乏生物領域的專家,一些企業甚至已經喊出“神經科學是人工智慧領域創新關鍵”的口號。
資料顯示,2011年,人工智慧識別影象的錯誤率是26%,2016年的錯誤率下降到3%,比人類的識別能力要高出2%,這樣的數字源於神經網路和深度學習在人工智慧領域的爆發。
類腦晶片讓機腦超越人腦
人工智慧正在改變各行各業,而晶片是實現人工智慧的載體,但傳統晶片卻遇上馮·諾依曼結構瓶頸。
目前,計算機採用的是馮·諾依曼體系結構,而滿足這個結構必須有一儲存器、一個控制器、一個運算器、必須有輸入裝置和輸出裝置用於人機通訊,另外,程式和資料統一儲存並在程式控制下自動工作。有人將這稱之為“記憶體牆”,意思是CPU再快,也要等記憶體。
如今,越來越多的人工智慧應用需要專門的AI加速器或計算卡,從業認識開始關注專門用於處理人工智慧應用中的大量計算任務的模組,與通用晶片不同,AI晶片主要用於處理專用任務,比如安防中高清視訊的識別、自動駕駛時的資料計算等等。這類的處理器主要分為GPU、FPGA、ASIC等型別,其中專用定製的ASIC晶片被認為是人工智慧晶片的主要方向,寒武紀的GPU,地平線的BPU都屬於ASIC晶片。
值得關注的是,在ASIC晶片裡還有一個特殊的群體——類腦計算,正如尤瓦爾·赫拉利的《未來簡史》中傳達出的觀點,人類開始複製自身,幾十年來,科學家一直“訓練”電腦,使其能夠像人腦一樣思考,而類腦晶片就是模擬人類大腦處理資訊的新奇的微晶片。
“為了應對各種認知任務,大腦要在短時間內儲存和處理各種感興趣的資訊,完成這個過程的大腦系統就是‘工作記憶’。工作記憶是形成語言理解、學習與記憶、推理和計劃等複雜認知能力的基礎。此外,基於生物層面的神經突觸訊號傳遞作用機制、腦區間環路特徵、腦資訊表達與處理、腦結構和功能圖譜、腦重大疾病發病的環路機制等成為研究熱點,這些都為人工智慧的突破性發展提供了新的方向。” 在9月18日至19日復旦大學舉辦的類腦人工智慧主題論壇上,復旦大學校長許寧生說。
研究表明,人類大腦平均每秒可執行 1 億億次操作,所需能量只有 10〜25 瓦特,如果讓一臺超級計算機來完成同樣的工作,需要消耗的能量超過人腦的 1000 萬倍。科學家們試圖通過模擬人腦運轉機制,利用神經元進行傳輸資料,使計算機能低能耗高功效地進行計算。
類腦晶片的研發非常困難,許寧生表示,復旦大學已經佈局了四年,期望通過腦科學的深入研究和神經機制的系統解析,“破譯”大腦資訊處理與神經編碼的原理,再通過資訊科技予以參照、模擬和逆向工程,形成新一代人工智慧通用模型與演算法、類腦晶片器件和類腦智慧各類工程技術應用等新型研究領域。
異構計算
“後摩爾定律時代”的新選擇
“摩爾定律”究竟還能走多遠? 一旦摩爾定律正式成為歷史,半導體產業該如何繼續向前邁進?過去30年裡,積體電路的工藝進步經歷了多個現象級的飛躍提升,例如,工藝從毫米、微米、奈米級進步,到現在的3-5nm工藝,接近現有電子材料及光刻技術的極限,然而,晶片廠商們突然發現,按照“摩爾定律”繼續提升晶片效能所付出的成本也變得越來越龐大,甚至已經成為當前積體電路行業面臨的最大挑戰:晶片設計和應用的程式設計開發越來越複雜,研發投入(IP、設計團隊等)和工藝製造越來越昂貴,而市場卻開始呈現碎片化的趨勢。
然而,在AI領域,卻呈現出另一種新的現象,不少企業紛紛宣佈推出自己的AI晶片,在本次WAIC上,地平線、寒武紀、酷芯等公司都展出了自己的AI晶片,且研究方向各有不同。記者發現,酷芯的AR8000系列晶片組,採用自己研製開發的無線通訊協議,可以在4G等移動蜂窩網路訊號弱的時候傳輸高清影象,2014年起,全球出貨的中高階民用無人機中,70%以上都是使用酷芯方案,而酷芯在WAIC上新發布的AR9201晶片組,是通訊與邊緣智慧處理的融合SoC(系統整合晶片),採用自主研發的遠距離無線基帶和射頻、高效能ISP (Image Signal Processing)、神經網路專用加速器、視訊編解碼等核心技術;地平線的自動駕駛軟硬體一體化計算平臺Matrix則在WAIC上入圍了世界人工創新大賽,也是入圍該榜單的唯一一個軟硬結合嵌入式人工智慧計算平臺,其二代自動駕駛處理器也已經基本成型,預計於明年1月流片,其算力從一代的1T提升至4-5T。
成本與需求的同步增加,使半導體行業越來越需考慮一個問題:能否通過晶片架構的創新,實現大幅提升效能和降低功耗的同時,顯著降低設計製造費用和晶片設計、應用程式設計開發的門檻,一個更小的設計團隊能不能完成複雜晶片的設計、應用開發的複雜度能不能大幅度降低。
在目前所有的架構創新中,量子計算、類腦計算等離大規模商用還有相當長的距離,而最近十分火熱的“異構計算”成為近年來架構創新的主賽道。
國內第一家從事下一代異構計算處理器晶片設計的積體電路企業華夏芯相關人士告訴記者,廣義來說,不同指令架構的計算單元(如CPU與GPU)之間實現高效協同計算都可以稱之為“異構計算”。全球異構系統架構(HSA)聯盟主席John Glossner認為,面對大資料、人工智慧對計算效能的爆發式需求,各種創新的神經網路演算法及相應的計算實現架構層出不窮,傳統晶片設計架構已經難以滿足應用對計算能力的需求,因此以異構計算為代表的架構創新正在成為一個新的風口,並且正在成為新一代軟硬體計算體系和高階複雜晶片的主流設計平臺。
但由於產品設計難度大、生態系統需要重新構建等挑戰,在過去很長一段時間裡,異構計算一直處於不斷演進中,John Glossner認為,必須要走建立相關標準和規範、眾多廠商協同合作這一途徑。
在中國,異構標準化行動也已開始,由HSA聯盟成員中國電子技術標準化研究院和華夏芯(北京)通用處理器技術有限公司牽頭,組建了HSA中國區委員會(CRC),目前成員單位已有40餘家,涵蓋中國本土知名的半導體企業、高校和科研院所,CRC主要針對中國異構計算的實際需求,對HSA標準進行擴充套件、適配和修訂,這些工作成果將反饋回HSA聯盟,成為全球標準的一部分。