1. 程式人生 > >“GAN之父”:當初為了深度學習買GPU,現在後悔沒多挖點比特幣

“GAN之父”:當初為了深度學習買GPU,現在後悔沒多挖點比特幣

這裡寫圖片描述

翻譯 | shawn
編輯 | 阿司匹林
出品 | 人工智慧頭條(公眾號ID:AI_Thinker)

Ian Goodfellow 是谷歌大腦團隊的一名研究科學家,他帶領的研究團隊負責研究 AI 領域中的對抗技術。他是生成式對抗網路(GANs)之父,《麻省理工科技評論》(MIT Technology Review)“35 名 35 歲以下科技創新者”得主,同時還是經典教材《深度學習》的主要作者。

然而,Ian Goodfellow 在成名之前並非一帆風順,而是歷經挫折。在近日的採訪中,這位如今的 AI 明星向外界袒露心聲,並一一列舉自己在成功前的種種遭遇。

這裡寫圖片描述
  • 如何克服挫折?

  • 如何評價當前的工作?

  • 對以前的自己有什麼建議?

  • ……

希望 Ian Goodfellow 的切身經歷和體會,能給大家一些啟發和鼓勵。

* 1. 您能簡單介紹一下你自己嗎?*

我是 Google 的一名 AI 研究員,我帶領的研究團隊致力於更好地理解 AI 系統的失敗,以便為負責任地發展 AI 制定明確的工程原則。我大部分時間都在研究如何讓 AI 更安全,比如:如何確保 AI 系統能識別惡意襲擊者的欺騙,不被襲擊者利用。

2. 您在推特上發了一連串曾經被拒絕的經歷,您能詳細講一下這些經歷嗎?就當作是您的「非正式的自傳」?

我的同事 Moritz Hardt 在推特上發文提醒大家“每年的這個時候都要謹記,成功學術事業的開始,總少不了被好的研究生院拒絕的經歷”。

下面是我學術生涯中的一些失敗經歷:

  • 當我還在斯坦福大學讀本科的時候,我立志日後從事神經科學工作,但我的生物和化學學得很辛苦。我的成績還算不錯,但是我不認為我能成為一名教授。

  • 後來我轉而研究電腦科學,我申請了好幾個本科生實習職位。值得一提的是,Google 拒絕了我。

  • 我曾經申請過一位斯坦福大學教授的夏季專案。我在申請書中附上了我的成績單,他回覆我“為什麼你在我的課上得到了A?”。原來他給我的成績實際上並不是 A。我原本認為是教授給分很慷慨,但是結果只是計算機計算分數時出了問題。結果我的實習申請不但沒有成功,反而讓學校調低了我的成績。

  • 我收到了其他幾家大型科技公司的實習邀約,但是工作內容都與機器學習或計算機無關。在我的簡歷中,你看不到這些失敗經歷,只有最終的成功經歷(我非常感謝 Willow Garage 公司和斯坦福大學的 CURIS 專案給了我從事機器人視覺工作的實習機會)

  • 讀碩士和博士期間,我大部分學期是沒有外部獎學金的。這意味著我必須擔任教學助理的工作或研究有補助金的特定課題,這樣我就不能專注於我的研究興趣。後來,我繼續申請了PBEEE(魁北克國外學生優秀獎學金)等獎學金專案。從 2009 到 2013 ,我的申請都被拒絕了,直到 2013 年第一學期,Google 給了我第一個深度學習博士獎學金。

  • ECCV 等計算機視覺大會拒絕了我在讀博士之前寫的大部分論文。我在機器人感知上做了很多研究,但是論文都未能發表。

3.您認為是哪些因素幫助您克服了這些挫敗?

上高中的時候,我在學校的辯論隊呆了三年,教練是兩位非常優秀的教師 Kerry Koda 和 Thomas King。

我的辯論經驗在很多方面幫助了我的科學事業,這讓我很驚訝。辯論經驗在克服挫敗時能派上用場,因為辯手們都懂得如何在情緒上應對失敗。每一輪辯論都有一個勝者和一個敗者。沒人永遠都是勝者。如果你辯論的時間長了,你就會快速地習慣這樣一種想法——敗了一輪後馬上換個地方再來一輪。你會學會避免過度反思和自責,而且你的預期也會經常進行調整。你會適應失敗與成功的不斷交替。

4. 有些人認為向外界展示曾經的失敗經歷其實是一種謙虛的自誇,您對此的看法是?

我在推特上發表我被拒絕的經歷時,人們的反應不是這樣。很多人感謝我分享這些經歷。我可以理解為什麼有人將我的這種行為看作是謙虛的自誇,但是我認為大多數人理解我這麼做是為了幫助其他人擺脫 Impostor Syndrome。(冒名頂替綜合症,用以指稱出現在成功人士身上的一種現像。患有冒名頂替症候群的人無法將自己的成功歸因於自己的能力,並總是擔心有朝一日會被他人識破自己其實是騙子這件事。他們堅信自己的成功並非源於自己的努力或能力,而是憑藉著運氣、良好的時機,或別人誤以為他們能力很強、很聰明,才導致他們的成功 。——維基百科)

5. 如果說失敗很常見,你認為人們是否可能反而不願意分享他們的成功經歷?

我不這麼認為。基本上,我們分享自己的成功經歷都是被迫的,不是為了工作業績稽核,就是為了申請獎學金……在向學術會議和學術期刊提交論文時,每個人都會在外界的鼓動下展示他們論文的優點,隱藏缺點。雖然我本人非常反對這種鼓動行為,但是我不認為這種行為短時間內這種會消失。

6. 之前我們談的都是一些帶有離散決策屬性的事件,比如獲得職位和發表論文。還有什麼其他型別的失敗事件嗎?您本人有這方面失敗的經驗嗎?

我認為失敗當中的大多數離散點(被某一所研究生院錄取或拒絕,或者論文被某一學術會議接受或拒絕)並不是那麼重要。

我在推特上發了被很多研究生院拒絕的經歷,被拒絕沒什麼了不起,因為也有很多研究生院接受了我。

比如,2009 年我遇到的最大的難題不是被 MIT 和卡內基梅隆大學等頂尖名校拒絕,而是不確定我是否能夠在接受我的斯坦福大學和加州大學伯克利分校等頂尖名校中做我想做的研究。我不知道我的導師會是誰(因為新入學的博士生要參加導師輪流計劃,在收到錄取通知時導師並沒有分配好)。在這些學校的導師中,很少有人支援深度學習研究。最終我選擇了蒙特利爾大學,並提前選擇了 Yoshua Bengio 作為我的導師。

我認為我遭遇的最大的失敗可能是:讀博士期間我大部分時間都在試圖用無監督特徵學習方法解決計算機視覺的監督學習問題,而當 Alex、Ilya 和 Geoff 因為用監督學習解決了這個問題而贏得 ImageNet 競賽冠軍時,這完全出乎我的意料。我認為,將時間浪費在寫論文上,結果論文走入死衚衕,這是我自己失敗的主要方式。現在在 arxiv.org 上發表論文變得很普遍,如果我的論文對其他研究者有影響,即使被學術會議拒絕,我也認為我的論文成功了。如果我的論文的影響很小,即使被學術會議接收了,我也會認為我的論文失敗了。

7. 目前您覺得有什麼事讓您感覺很失敗或者不確定嗎?

四年以來,我一直在努力理解輕微干擾輸入為什麼會很容易讓神經網路困惑。一方面我自己進行這方面的研究,另一方面我努力讓其他研究人員對這個課題感興趣,幫助解決這個問題。但是,現在還是沒人知道如何在這個問題上構建一個高精度模型。

如果事業成功的傳統標準來衡量:今年我提交給國際機器學習大會(ICML)的論文得到了非常 brutal (殘忍)的評價,預計我的大部分論文都會被拒絕。

還有一件事值得一提:我做研究的方式是快速嘗試若干想法,檢驗它們是否有希望,然後淘汰大部分想法。如果當天時間充足的話,我可能會驗證 3-5 個想法,最後發現它們全都不可行。我在每個想法上投資的時間很少,但是我可以驗證很多不同的想法。從這個角度看,在某些想法上遭遇失敗只是我工作的一部分而已。

8. 你認為在評價研究者是否成功時,論文發表佔多大比重?還有哪些常被忽視的評價因素?

我認為人們評價成功的標準使社會忽視了某些意義上的成功人士。

例如,我們花很多時間評價別人和他們的工作,但是我們很少關注評價過程本身。沒人確保會議論文評審過程的公平性和準確性。NIPS 實驗告訴我們,評審過程中存在很多幹擾(Eric Price 證明了評審們在如何處理某一篇論文上意見相左的情況要比意見一致的情況多)。目前,還沒有人率先嚐試製定更好的、有證據表明確實有效的評價程式。研究界應該重視能夠改善整個研究界研究效率的工作,但是目前我們對這些工作一點也不重視。

9. 您是否認為機器學習這個領域與失敗有著某種獨特的關係?這種關係會對不同群體產生不同的影響嗎?

在機器學習界,大量成功論文快速發表並影響著其他論文的快速湧現,這一點其他領域望塵莫及。舉例來說,Ilya Sutskever 的論文在谷歌學術搜尋(Google Scholar)擁有超過 5 萬次的引用。在數學界,最近的菲爾茲獎(Fields Medal)獲得者沒有一人的論文引用次數超過 5 千次。

在機器學習界,論文的成功是爆炸性的,這非常奇怪。有一部分原因是我們在 arxiv.org 上發表論文,而不是主要靠同仁評審論文。說實話,我不清楚這會對不同的群體產生什麼樣的影響。

10. 您怎麼看待機器學習中的負面結果?

我認為從機器學習中的負面結果中提取價值很困難,因為造成負面結果的原因可能很難說清楚。負面結果可能引向某個想法的根本性錯誤,但是也可能只是由非常小的軟體故障、超引數值取值不當、模型太小等因素造成的。

11. 如果您有機會見到機器學習界所有的資深學者,您會對他們說什麼?

如果我可以見到機器學習界所有的資深學者、會議組織者或期刊編輯,我會對他們說:機器學習界需要找到更好的方法來解決論文貢獻(credit)爭論。

目前,如果有人覺得其對某篇論文應有的貢獻(credit)沒有在該論文中充分提及,直接聯絡作者可能是最常見的爭議解決方法。如果只是因為論文作者疏忽的緣故(新論文的作者不知曉舊論文),這種方法就可行,但是如果雙方意見不同,局面可能就會變得很難看。當沒有中心權威機構而且說服不成功時,這些論文作者可能就會補償或威脅另一方,但是大多數人是給不出多少補償的。

如果受到不公平待遇的是有名的資深教授,向初級研究員(例如博士生)要求 credit 是非常難堪的。

我的論文在機器學習界名聲打響後,我在處理這種糾紛上浪費的時間越來越多。

如果某個學術會議或期刊能夠建立一箇中心機構,安排中立的第三方仲裁這些糾紛,情況就會好很多。

12. 對以前的自己有什麼建議?

當年我為了深度學習而購買的 GPU,應該用來多挖點比特幣。

作者:Veronika

原文地址

這裡寫圖片描述