1. 程式人生 > >李飛飛、王海峰……悉數那些人工智能領域的傳火者

李飛飛、王海峰……悉數那些人工智能領域的傳火者

傳火者

12月14日的谷歌開發者大會上,身著紅衣的李飛飛不僅激蕩起了臺下的掌聲,還成為了各路媒體報道中討論的焦點。這不得不讓人感嘆,我們又回到了崇拜科學家的時代。

或許是因為人工智能本身就是一個學術話語權極強的領域,現在的AI企業不管體量大小,往往都有教授、專家坐鎮,發布論文的數量和學術競賽排名,似乎也成了考量企業技術含金量的標準。

可問題的關鍵是,我們不僅優秀的科研成果,更需要能把技術從論文中帶到我們身邊的傳火者。今天就來談談,怎樣才能稱得上人工智能領域的傳火者。

論文產品化:象牙塔內外的海水與火焰

很多人的概念裏都存有一個誤區,論文發的多、專利申請的多、競賽排名足夠高就意味著技術有著更高的實用性和商業前景。學術上的持續探索當然是人工智能能不斷進步的基礎,但從論文到產品、再到優秀的產品,這期間的裏程往往比我們想象中要遙遠得多。

不管是論文還是賽事,往往都會給出一個理想的恒定實驗環境來追求某一項技術的極致可能。比如給出統一的硬件標準或數據庫,而得出的結果也是在某一標準下的最佳結果。

這就導致一種尷尬的結果:有時論文會走向一種非常刁鉆的方向,很難實際應用在生活中。像是耗費大量計算資源去追求極小的模型壓縮,或是犧牲計算速度去在極小範圍內提升模型準確率。但這些研究成果往往只能在仿真環境中起作用,要想應用到現實中來,往往會遇到這樣那樣的問題。

現在很多技術模型都是開源共享的,將公開的模型進行參數調試,從一個領域移植到另一領域並不難,可想要實現產品化,就要為模型尋找到合適場景,嵌入到適用的軟件或硬件中。在這一過程中,如何面對技術開源,難以建立壁壘的問題就是一個難點。

即使把技術成功產品化,也要考量產品的實際應用性。人工智能技術的加入是不是真的能提升用戶體驗,體驗的提升和所耗費的成本之間是否又能找到平衡點……很多時候,人工智能產品還未經市場檢驗,就已經折戟在論文產品化的過程中了。

論文和排名僅僅是人工智能產業的一部分,我們不能否認它的價值,但也要保持清醒的頭腦。有些企業靠這些可以拿到大筆融資,但這絕不是企業成功的標誌。過往,論文和會議競賽中的技術存在於科研環境中,代表的是人工智能無限的可能性。幸好,如今科學家們紛紛走出了象牙塔,把技術從仿真世界帶到物理世界,向我們展示人工智能的應用性。

把目光投向物理世界,

學術力量落足在哪?

在今天的人工智能熱潮中,既然有人靠水論文拿融資,自然也會有人可以成為技術的傳火者,把學術能力化為產品能力甚至商業能力,成為人工智能時代的“傳火者”。

技術分享圖片

(幫谷歌AI連接中國的李飛飛)

拋開谷歌的光環,從加州理工畢業的李飛飛自身也有著極高的學術起點,在斯坦福實驗室中的身體力行培養出了不少牛人,也憑著TED上強大的演講能力吸引了不少人關註計算機視覺領域。

李飛飛對人工智能領域最大的貢獻無疑是創立了世界上最大的圖片識別數據庫ImageNet。此前機器學習一直飽受過擬合和泛化的困擾,學界一直試圖在模型上尋找解決方式,直到李飛飛開始主導ImageNet的研究,從數據集入手試圖改變遊戲規則。

ImageNet的影響力越來越大,甚至從中誕生了卷積神經網絡這樣實用性極高的技術,計算機視覺和深度學習也越來越多的應用在物理世界中:社交網絡的圖像標註、自動駕駛的物體監測……包括李飛飛自己在谷歌街景上添加的種種功能,如通過分析汽車分析街區政治傾向等,在CV和產業結合中締造了更多想象空間。

大量的落地應用也再不斷的向CV技術提供反饋,物理世界的技術應用也催化了仿真世界中技術的發展。

技術分享圖片

(為百度布局AI的王海峰)

NLP和CV兩個領域,都聚集了大量華人科學家。在學界和產業界都有布局的,王海峰算是其中一個典型。

王海峰在學界的成就很高,是迄今為止國際計算語言學會(The Association for Computational Linguistics)唯一出任過主席的華人,也是首位來自大陸的會士。還曾獲國家科技進步獎及創新爭先獎等等。

2010年王海峰入職百度,百度也給了他很大的發揮空間。他先後為百度開拓並發展了自然語言處理、知識圖譜、深度學習、語音技術、圖像技術等多個技術方向,並在2013年上半年作為執行負責人協助創建了百度深度學習研究院(IDL),這些開拓性工作奠定了百度人工智能的基礎。在擔任百度搜索業務群組任副總經理期間,王海峰總負責百度搜索引擎、信息流、手機百度等百度最核心的業務,並打造了小度機器人、度秘等新的明星產品。從這些動作就能看出,王海峰不僅科研能力突出,還很善於產品創新及工程實施。

我們今天看到的百度搜索、百度翻譯等產品的變化,以及度秘等新產品的誕生,在用戶體驗的感受差異中,實際是神經網絡、語音識別和知識圖譜等等技術的理性呈現。其實這些就是學術和產業之間產生的化學反應。搜索引擎源源不斷產生出的數據,加上王海峰團隊在學界的先行經驗,最終構成了百度在人工智能方面的技術優勢。

相比BAT其他的人工智能大牛,王海峰相對低調,大概這也是“工程派”的特征之一。但他和他的團隊的確為百度後續諸多產品的智能化奠定了基礎,屬於百度AI中的隱形部隊。正因為百度AI技術平臺體系發展脈絡始終清晰有序,才有了從底層打造平臺、開放生態的能力,接入更多產品化和工程化端口。在人工智能的長線戰爭中,工程化和產品化能力可以為百度贏得更多優勢。

優秀的科學家、豐富的數據源和業務落地場景三個元素單獨存在時都很難構成顯著的優勢,但三者結合後,帶來的能量就不容小覷了。

技術分享圖片

(教機器人疊毛巾的Pieter Abbeel)

提到強化學習,大多數人會認為這是一項距離現實非常遙遠的技術,不過一直有人在嘗試著把這一技術帶到現實,Pieter Abbeel就是其中之一。

在博士時期,Pieter Abbeel就與導師一同提出了師徒學習這一強化學習中的重要概念。在伯克利任教期間,還因讓機器人通過強化學習學會疊毛巾獲得了MIT頒發的TR35獎項。後來入職馬斯克的OpenAI,推出了著名的機器人訓練場Gym。Gym雖然也還是一個仿真環境,但本質來說已經是在為強化學習應用在實際場景中做出準備。尤其當場地、費用、用時這些問題成為強化學習落地訓練的阻礙時,仿真環境的出現讓很多團隊可以在低成本的前提下快速訓練智能體。

Pieter Abbeel自己已經把強化學習機器人帶入了商業領域,直到今天,矽谷機器人制造商Willow Garage的很多產品中還有Pieter Abbeel利用強化學習訓練的成果。如今Pieter Abbeel已經離開OpenAI,創立自己的團隊,專註於利用強化學習讓現有硬件設備自主學習完成任務。

自動化的普及度不斷增高的過程,本質上也是機器人訓練成本不斷降低的過程,強化學習的應用的落足之處也在其中。

革命來臨前夜,天秤兩端的學與業

以上三位科學家僅僅是人工智能領域眾多傳火者的一個縮影,卻也能讓我們管中窺豹,領悟到一點人工智能產業發展的勢頭。

有一些生物學界的人士曾經對這次人工智能浪潮做出過忠告,說今天的人工智能特別像十幾年前的生物學,論文滿天飛、大學猛開專業、專家教授紛紛“下海”創業。最後生物學卻因為產業化能力不足,反倒湮滅了學術界的星星火光。而人工智能被稱為下一次工業革命,自然要把“學”和“業”放在天秤的兩端。

“學”的能力,既包括了論文數量、競賽排名,也需要考量技術的創新型和實用性。

像現如今大火的DeepMind,他們發表的很多關於深度學習的論文中並沒有利用太多超前的方法論,而是引源上個世紀的認知科學方法,用來解決今天的現實問題。

至於“業”的方面,往往要看技術的根紮在哪裏。學術能力當然可貴,但僅僅依靠學術很難支撐起人工智能未來的宏圖。以上三個案例中,科學家們雖然都出身象牙塔和實驗室,但也都是典型的工程派,把技術的根基深深的紮在了大企業和應用產業中。廣泛的業務和廣泛的應用場景意味著源源不斷的現實數據,以此吸取的養分,才能讓科學家們在仿真世界研發出的模型無限適用於物理世界,讓技術切實影響到人們的生活。把工業革命的火種帶到現實中來。

不過我相信人工智能產業很難重蹈生物產業的覆轍,一個顯著的苗頭就是,人們正在對天秤嚴重失衡的企業失去信心。比如此前的智能音箱風潮,市場上已經看不到前兩年對智能手環一類產品的熱情,反而換來了不少對智障音箱的嘲諷。又比如一直強調自己學術背景的科大訊飛,最近也因為落地場景匱乏而飽受爭議。

歷經了從“.com”時代的幾次泡沫,我們已經越來越清楚自己想要的是什麽,對於空中神殿的勾勒的確迷人,可想要真正改變現狀,還需一次火種的傳遞。


李飛飛、王海峰……悉數那些人工智能領域的傳火者