專訪 | 今日頭條李磊:頂級AI專家是不分學校和背景的,年輕人要有自己的判斷

分類:資訊 時間:2017-07-09

今日頭條科學家、人工智能實驗室總監 李磊

文 | 鴿子

李磊博士是今日頭條人工智能實驗室(Toutiao AI Lab)總監,原百度美國深度學習實驗室“少帥科學家”,師從數據挖掘領域權威Christos Faloutsos教授,主要研究領域為深度學習、概率模型與推理、自然語言理解,以及時間序列分析。在國際頂級學術會議發表學術論文30余篇,擁有三項美國發明專利。

近日,這位研究出身,如今又投身工業界的博士接受了CSDN的專訪,采訪中李磊分享了他對當下人工智能過熱的一些看法,並結合自身的求學與從業經歷,為從事人工智能的青年學者提出了一些中肯的建議。

7.22-23日,中國人工智能大會(CCAI 2017)將於杭州國際會議中心舉行,李磊將作為“人工智能青年論壇”共同主席主持會議,歡迎青年學者到現場參與討論。

應用實踐與AI研究

CSDN:很多聲音都在說人工智能存在“泡沫”,你怎樣看待這個問題?

李磊:人工智能是否存在泡沫,是看對技術的預期是否符合實際能力,人工智能技術是現實可用還是未來兩三年會成熟,還是10年的將來。如果過高預期,承諾無法兌現,大量投入無法在產品上產出,則是泡沫。當前看學術界和工業界不是存在泡沫的問題,而是認識上有偏窄的危險。人工智能不僅僅是機器學習或者計算機視覺,機器學習也不局限於深度學習。

CSDN:那你認為哪些AI技術可以在短期內實現應用落地?

李磊:我覺得人工智能,確切來說應該是機器學習在C端的成功應用需要滿足三個條件:首先是使用頻率高、其次使用成本低,最重要的是,AI應用輔助的決策本身要比較輕並且低風險,比如買房這樣重大的決定用AI就不太合適。

今日頭條之所以能通過AI技術顛覆傳統的信息分發行業,也是因為符合以上三個特點。當下信息獲取需求旺盛,面對海量信息,機器或者算法進行分發的成本要遠低於人力。並且推送信息的決策本身也比較簡單,即使偶爾推送的內容用戶不感興趣,也不會對生活有非常大的影響。

CSDN:還有哪些場景同樣滿足以上三個條件,也適合機器學習?今日頭條內部還會做哪方面的嘗試呢?

李磊:同樣滿足上述條件的應用我覺得YouTube和Amazon商品推薦也都是。Youtube做UGC視頻的個性化推薦,Amazon是個性化商品推薦,都做得不錯。

目前頭條的其他幾款產品包括火山、抖音、問答等等也都是基於機器學習進行個性化分發。

同時,頭條也在利用人工智能進行對低質、低俗內容的審核。

CSDN:你目前花精力最多的地方在哪裏?正在解決什麽難題呢?難在何處?

李磊:我目前精力花的比較多的難題是如何用人工智能更好地進行內容識別。包括識別文章是不是虛假內容、有沒有廣告信息、文章的質量包括文章內的配圖是不是合適等等。

通過人工智能進行內容識別的難點其實就是自然語言理解的一些難點。它很大的一個困難是語言中充滿了歧義,也就是語義的復雜性,包含因果關系和邏輯推理的上下文等。

另外圖文是否相符這個問題上,目前包括學術界也都還沒有明確方法和研究模型,我們也在做一些探索。

CSDN:你近期正在關註哪些AI理論和實踐方面的新進展?為什麽吸引你?

李磊:最近在看一些非監督學習的方法,比如說UC Berkeley CycleGAN對抗生成神經網絡的一系列工作。它主要是利用非平行的樣本。傳統監督學習需要X(數據)、Y(標簽)一一對應來做訓練,非監督學習的方法只需要一組X、Y,不需要一一對應,仍然可以訓練出其中的模式。

我在頭條平時做數據需要比較多的標註,數量包括標註質量都是比較大的難題,如果能用非平行樣本來進行訓練,會對實際模型有比較大的幫助。

另外,機器翻譯方面最新的基於註意力機制(attention mechanism)的網絡框架我也有關註。關註最新進展或者說去讀一些最新的論文,不一定是說這些算法或者模型做的非常好,而是它們可能會帶來一些新方法和新的思考角度,這些東西也許會幫助我們在實際應用中有提高。

個人經歷及影響

CSDN:你在上海交大讀本科,卡耐基梅隆拿到博士學位,中間在加州大學伯克利分校工作過(做博士後研究員),請談談這三所學校在AI領域,都有何優勢與劣勢?請再列舉兩所你欣賞的,在AI領域有建樹的高校。

李磊:上海交大是國內計算機專業頂尖的幾所高校之一。交大開設的ACM班是對計算機學科的教學作改革,在本科的教學上就為學生打下了良好的理論、算法和工程基礎。像分析與變分、數理邏輯、計算理論、算法導論都是後面學習AI的基礎。同時,它開設的一些大作業課程比如操作系統、編譯原理、數據庫、計算機網絡等等幫助學生把工程需要的各種能力也都培養起來了。

卡耐基梅隆大學應該是最早設立計算機學系的學校。1956年CMU建立了計算中心,1965年7月建立了美國乃至世界的第一個計算機科學系,後來成為計算機學院。它在AI領域下的門類非常全,可以認為是廣度上最強的研究機構。計算機學院下面有好多系都在做AI方面非常前沿的研究,包括機器學習系、機器人所、語言技術所、人機交互所等九大科研系所。AI領域從理論到應用的各類問題在CMU都有世界頂級的專家在進行研究。

當然這和CMU早期比較深厚的傳統計算機基礎有關,計算機系的創始人Alan J. Perlis,Allen Newell,Herbert A.Simon(漢語名:司馬賀)都是圖靈獎得主。Simon的學術工作對整個AI領域、心理學和經濟學的影響是巨大的,比如早期的自動解題機GPS,以及分析行為的有限理性理論。90年代Raj Reddy又憑借設計與構建大規模人工智能系統的先驅性貢獻獲得圖靈獎,李開復、沈向洋都是他的學生。我在CMU讀博期間在AI的深度和廣度上都受到的很好地訓練。

伯克利(UCB)在AI領域的一些方向,尤其是統計機器學習方面非常出色,擁有像Michael Jordan、Martin Wainwright這樣頂級的教授,僅Michael Jordan就培養了非常多機器學習方面頂尖的人才。此外,UCB在邏輯和概率方面也非常突出。

UCB在過去五年有一個非常成功的實驗室——AMP Lab。這個實驗室將系統和人工智能、機器學習、數據挖掘很好地結合起來,所以做出的成果更偏向工業界大規模應用。也正是如此,AMP Lab後來孕育了很多不錯的創業公司。最有名的三個是Databricks,Alluxio (前身Tachyon),以及Mesosphere,這些公司做出來的工具和產品被業界廣泛使用。

與其他高校相比,我認為UCB更接近產業,可以說在研究產業界所遇到的實際AI相關的問題上做得更好。首先是因為他的地理位置比較有優勢,離矽谷不算太遠。另外就是UCB的一些老師也非常關註研究和產業界結合。從最早計算機體系結構方向的泰鬥David Patterson開始,就嘗試過自己創辦公司。UCB是有教授直接或間接參與企業研發工作的傳統的。

AI領域非常廣,美國也有很多學校在不同的方向和領域上做得出色。如果再舉兩所比較欣賞的名校,我個人更欣賞MIT和西雅圖的華盛頓大學。

MIT也是傳統計算機領域積累雄厚的一所學校,早期的有Marvin Minsky教授,他奠定了人工神經網絡的研究基礎,並且MIT也是有很多實驗室以及學者在做AI相關的最前沿的研究,像計算機視覺和認知科學結合的一些工作。

華盛頓大學應該說是近十幾年來在AI或者說CS領域成長非常快的一所高校,尤其是在機器學習方面,招了很多年輕有為的老師,比如Carlos Guestrin和Noah Smith,因為他們兩位是從CMU過去的,所以我比較熟悉。我覺得說一個學校優秀,很多時候在於它的老師和學生。老師是不是做出了世界矚目的前沿工作,學生們畢業後是不是同樣在世界上有影響力的機構工作。

CSDN:你曾在微軟、谷歌、IBM TJ Watson這些國際企業工作,它們對你有怎樣的影響?回國加入今日頭條,與你之前國外的工作氛圍有何不同?國內外企業區別最大的地方是什麽?

李磊:這三家機構的業務方向不同,所以文化上也有很大差異,當然對我的影響也都不大一樣。

我認為谷歌是最貼近產品的一家公司,我在谷歌當時做的主要是應用型的研究工作,在實習期間得到了很好地“工程”鍛煉。

谷歌對實習生的要求與正式員工沒有差別,包括代碼review,包括工程怎樣寫的可靠,包括測試等等,這些工程經驗我是在谷歌學習的。

微軟實際上更偏向研究。我在微軟的兩個機構都實習過,我記得我在西雅圖時,導師帶我去數據中心,那是我第一次真正接觸大型企業的數據中心,它大概像沃爾瑪一樣大,當時還是非常震撼的。看到我們做的研究工作可以幫助管理這些數據中心,降低能耗,我覺得自己的工作非常有價值。

在IBM做的工作是用機器學習分析醫療數據,IBM更多的是讓我看到一個成熟的企業是怎樣運作研究機構,並讓研究機構對外產生價值。因為IBM研究中心當時不止對企業內部支持,也接外部機構的研究項目,比如美國科研基金的一些項目。

在這些頂級公司中工作,我比較大的收獲是可以接觸到很多我研究領域以外的研究方向,並且讓我了解科學研究在企業內是如何應用落地的,這對我日後的科研和工作對提供了非常大的幫助。

國內外企業在氛圍上的其實沒有特別大的區別,反而是不同類型企業之間的工作氛圍會有比較大的差異。比如互聯網公司和傳統IT公司的氛圍就會略有不同,工作節奏也不一樣。相比而言,互聯網更靈活,我認為它最大的特點是叠代模式,就是說第一個版本不一定要完美,沒有特別大的問題就可以考慮上線,後續再不斷改進叠代。但傳統IT企業很多軟件實際上是服務於客戶的,肯定要保證質量,所以很多項目都是力求完美。小型創業公司、中型創業公司和大公司之間的氛圍和文化差別會比較大,對每一個個人的要求也有所不同。

但如果同是互聯網公司,國內外區別不大,我覺得今日頭條和谷歌、Facebook的氛圍實際上就非常相似。

AI人才培養

CSDN:在實踐中,AI技術應用於多個領域,一個領域中的經驗,能否復制到其他領域(例如從事視覺研究的青年學者,轉而從事語言智能方面的工作)?需要註意些什麽,難點又有哪些?

李磊:完全復制是不可能的。但一個領域的經驗可能會給其他領域帶來借鑒。比如說傳統做視覺考慮一張圖空間上的相關性,這種相關性可能在語言層面也會有。理論上在應用角度從一個細分領域轉做另一個細分領域是可以的,這些領域本身還是比較相關的。當然這個具體還要因人而異,和他的技能水平和知識面都有關系。

以視覺和語言為例,它們之間的模型可能會有些不一樣。視覺上卷積網絡可能會用的比較多一點,語言因為是文字的線性結構所以用循環神經網絡會多用點。但真正打算從事AI行業的人不應該只知道卷積或者循環神經網絡,更應該知道神經網絡這大一類,知道概率模型、稀疏化和感知壓縮方法、決策樹、強化學習等等一些方法,應該了解和學習的更廣泛。

CSDN:根據你的觀察,企業對AI人才的需求規模有多大?人才梯隊會是怎樣?是否只有頂級大學畢業才能成為一流AI專家?

李磊:因為我也沒有更多的數據和資料,所以沒法籠統的說企業對AI人才的需求規模有多大。並且不同的企業對AI人才的需求也不同。有些企業的核心業務可以用AI的方法實現自動化降低人力成本,那可能他對AI人才的需求就會比較旺盛,而有些企業可能對AI人才的需求就不多。

一個好的AI團隊中可能需要一些人視野廣闊並能在某一領域有比較深入的研究,還需要一些人才能將研究和應用結合,更好的實現工程化。

未必只有頂級大學畢業的人才能成為一流的AI專家,頂級大學既不是充分條件也不是必要條件,還是看個人。比如蒙特利爾大學,當然它是一所很好地學校,但是之前大家也並沒有認為其計算機界是非常頂級的大學,但最近幾年在深度學習方面,有非常出色的表現,這個領域的很多學生也深受業界和學界追捧,被認為是一流的人才。

CSDN:普通技術人員,或者非科班出生的程序員,如果也想躋身AI大潮,應該從哪方面下手?他們的機會在哪裏?

李磊:當然有機會。我之前帶過一個實習生,非科班,學工商管理出身,之前從沒系統的學習過機器學習,但憑借自己的興趣和努力,也在從事AI領域的工作,並且做的很不錯,在頂級會議發了論文。類似的例子不止一個。

主要取決於三點,興趣、努力和選擇。你要判斷好你想用AI做什麽,之後要有持續的投入,而興趣是這些的源動力。

如果沒有經驗又對AI感興趣,我建議可以從學習使用一些AI的工具像TensorFlow、MXNet開始,解決一些具體問題。之後可以進一步了解這些工具背後的原理,深挖一些理論,歸根到底是統計方法、邏輯和優化方法,然後可以去讀一些最新的論文嘗試做一些創新。

CCAI 青年論壇使命

CSDN:作為“CCAI青年論壇”主席,根據你的觀察,這個青年學者與更資深的學者又哪些不同,差距通常在什麽地方?容易陷入哪些誤區?

李磊:資深與非資深,我們可以看一下真正第一流的學者有什麽標準,比如Micheal Jordan。第一流的學者可以在一些可能剛剛起步的研究方向中帶領研究向前並持續產生影響。年輕一代更有energy,但如果想定義新的領域可能比較難,這是有差距的地方。不過現在也有一些例子,像Google的一些年輕科學家,現在也可以帶領一些新領域的研究。

這個群體最容易陷入的誤區可能是什麽流行做什麽,我覺得年輕學者要向第一流的學者學習,要有自己的判斷,不盲目,並且能在判斷後堅持投入研究。

CSDN:作為 CCAI 人工智能青年論壇的主席,對於組織這一論壇,你的出發點是什麽?本次論壇將主要圍繞哪些內容展開?希望為聽眾解決哪些問題?

李磊:由於隨數據和計算資源的增加以及算法改進,人工智能技術開始被廣泛應用,並且在圖像識別、語音識別等特定領域都取得了不錯的進展。

但人工智能仍然面臨很多挑戰,像如何發展對訓練樣本更高效的人工智能技術,如何在信息不完善不確定的非結構化環境下進行高效學習和決策等等。基於此,青年論壇邀請到多位活躍在學術界和工業界的青年學者,請他們在此分享各自最新的研究成果並且對人工智能的未來發展進行深入探討。

CSDN:你是從哪幾個維度來組織嘉賓陣容的?由此構建起的人工智能青年論壇有著哪些獨特之處?

李磊:組織嘉賓陣容主要是邀請了一些青年學者,並且包含了國內與國外、工業界與學界的組合,希望能從不同的角度產生碰撞。邀請到的嘉賓包括清華大學、浙江大學、美國華盛頓大學的教授以及阿裏巴巴人工智能實驗室的科學家等等。

專屬福利 :中國國內級別最高、規模最大的人工智能大會——中國人工智能大會(CCAI)將於7.22-7.23在杭州舉行,目前大會 8 折專屬優惠門票火熱搶購中,趕快掃描下方圖片中的二維碼或點擊【閱讀原文】火速搶票吧。

關於CCAI

中國人工智能大會(CCAI),由中國人工智能學會發起,目前已成功舉辦兩屆,是中國國內級別最高、規模最大的人工智能大會。秉承前兩屆大會宗旨,由中國人工智能學會、阿裏巴巴集團 & 螞蟻金服主辦,CSDN、中國科學院自動化研究所承辦的第三屆中國人工智能大會(CCAI 2017)將於 7 月 22-23 日在杭州召開。

作為中國國內高規格、規模空前的人工智能大會,本次大會由中國科學院院士、中國人工智能學會副理事長譚鐵牛,阿裏巴巴技術委員會主席王堅,香港科技大學計算機系主任、AAAI Fellow 楊強,螞蟻金服副總裁、首席數據科學家漆遠,南京大學教授、AAAI Fellow 周誌華共同甄選出在人工智能領域本年度海內外最值得關註的學術與研發進展,匯聚了超過 40 位頂級人工智能專家,帶來 9 場權威主題報告,以及“語言智能與應用論壇”、“智能金融論壇”、“人工智能科學與藝術論壇”、“人工智能青年論壇”4 大專題論壇,屆時將有超過 2000 位人工智能專業人士參與。

點擊下方“閱讀原文”查看更多內容。

關註公眾號:Mcbang_com 了解更多精彩,關註:chayuqing_com 娛樂資訊早知道!

[廣告]贊助鏈接: 輿情監測,互聯網輿情首選查輿情:http://www.chayuqing.com/ 四季很好,只要有你,文娛排行榜:http://www.yaopaiming.com/
Tags: 李磊 人工智能 學習 泡沫 應用 工業界

文章來源:


ads
ads

相關文章
ads

相關文章

ad