深度學習之江湖~那些大神們，不相信只有我一個人愛八卦

阿新 • • 發佈：2019-01-18

如果以門派論：
Jeff Hinton是深度學習的"開山祖師爺"，也是武林中的"少林派"的主持，德高望重，96年創立人工神經網路的BP演算法，驚天動地，當年被給予厚望可惜ANN沒有發展起來後來反被搞SVM的人壓制了將近20年，據說2006以前Hinton系的人被壓制到每年的NIPS ICML這樣會議都發不了，因為一定會被SVM的人斃掉。終於，蟄伏良久，厚積薄發，王者歸來，2006年開始推出深度神經網路，終於引領了這波浪潮。Google去年收購了2個深度學習的公司，一個是DNNResearch，只有三個員工分別是Hinton和他的兩個博士生。另外一個是英國的DeepMind，創始人也是Hinton的博士生，傳言花了5億刀。

Yann Lecun可以算作DL江湖的"武當派"掌門人，因為武當派的開山鼻祖"覺遠大師"也是師出少林。Yann Lecun一手創立卷積神經網路CNN，這也是目前DL在影象上邊發力的必備武器。去年NIPS 2013會議上，扎克伯格突然現身，宣佈Yann Lecun被他招攬到了facebook了。Yann Lecun還是紐約大學Data science center創始人和主任。

Yoshua Bengio, 從2006年開始，主要是Hinton、Yoshua、Yann Lecun開始發起的深度學習的浪潮，很多這個領域的牛paper都是出自Yoshua的手(而且是自己寫)。當前學習DL有力的工具PyLearn2和Theano都是出自他們實驗室。對其瞭解不多，只是覺得他的paper特別的厚而且自成體系。最近看到對他的採訪，讓他評價一下"為什麼最近這些深度學習的大牛都投身工業界了?"，他的回答是："我喜歡學術界，因為我可以選擇研究我喜歡的課題，我可以選擇設立一個長期的目標來為之努力，我可以為全人類的福祉來奮鬥而不是某一個特定公司的利益，而且我可以非常自由的公開討論我的研究成果和進展"。不過，Yoshua會不會被某公司收攬呢，一切不好說。凡事親力親為，門下弟子不多，淡泊名利，從這個角度看，Yoshua Bengio是應該算作"逍遙派"的"無崖子"吧。

Andrew Ng，香港出身，中文名"吳恩達", 近幾年機器學習界炙手可熱的後起之秀，年齡只有38，而且是最近才結婚(在twitter上看到他show的婚紗照了)，stanford計算機副教授 & AI Lab主任。成果無數，產出驚人，比如和David Blei 以及他們的老師Michael Jordon建立的LDA就耳熟能詳,此外還有Reinforcement Learning、Sparse coding、Bayesian network、NLP、Deep learning方面奇功無數(水平有限，無法概括大牛的領域)，在其主頁上粗粗瀏覽了一下有160多篇論文，基本上統治了ICML NIPS AAAI等所有相關領域國際頂級會議和頂級期刊。前兩年和D.Koller(Graphic model & Bayesian很厲害的一名女教授)合作推出了Coursera，風靡全球，讓人足不出戶就能聆聽大師講課。感覺Ng在學術界和工業界都很能混的開，"Google Brain之父"完了之後就是"Baidu Brain之父"，既能"出世"又能"入世"，進退自如，恢恢乎遊刃有餘，以stanford為據點培養了一大批博士生(比如Quoc Le現在是Google Brain的核心人員 Richard socher去年在NLP的文章也很精彩)，劍法飄逸，涉獵深廣，最重要的是年輕，這點來看可以算作武林屆的"令狐沖"。

那麼誰是"風清揚"呢("風清揚"和"逍遙派"的關係待考證)，必然是其師Michael Jordon了，機器學習屆的"泰山北斗"，就像在”風清揚“在華山一手開創劍宗一脈。Michael Jordon也是一手開創統計ML, 涵蓋的領域包括： Bayesian nonparametric analysis, probabilistic graphical models, spectral methods, kernel machines and signal processing, statistical genetics, computational biology, information retrieval and natural language processing(摘自其主頁介紹http://www.eecs.berkeley.edu/Faculty/Homepages/jordan.html)，正好9個領域，簡直真真是"獨孤九劍"了，讓人歎為觀止。

Jeff Dean, 人稱網際網路戰神，Google Senior Fellow(Google工程師最高級別，這個級別就是為Jeff Dean設立的)，締造了谷歌的很多系統和框架，極大的影響了當今網際網路、大資料的技術深度和演進。其貢獻包括：MapReduce BigTable的發明人(谷歌老三架馬車是GFS Mapreduce Bigtable)那2篇牛paper作者，Google Adsense & Adwords第一個版本作者，Five generation谷歌網頁檢索系統作者、Protocal buffer作者，分散式作業系統創始人，Google News作者，Spanner作者，DistBelief作者(這個和深度學習相關), Google Translate創始人。大規模深度學習網路的第一個系統算是DistBelief, 當然對外的專案名稱叫做"Google Brain". DistBelief當時用了1000臺機器、16000個核做了一個深度神經網路(paper: large scale ditributed deep networks)，算是在工業界率先開啟超大規模深度學習網路的先河。Jeff Dean在國外內工程師心目中簡直是神一般的存在，廣為流傳的Jeff Dean的搞笑段子就是一個最好的說明。早期focus在編譯器、並行處理、大資料架構等系統方面，近期看到的一些產出都是在機器學習+大規模系統的方面，左手機器學習，右手無出其右的架構和系統，所以從宗師級的來看，Jeff Dean應該算全真教的"王重陽"。

當然深度學習界還有一些響噹噹的人物，比如Li Deng、Dong Yu、Kai Yu，前兩位是在微軟雷蒙德研究院，和Hinton深度合作，將DL在語音識別、語音合成上的應用提上了一個新臺階，在DL的發揚光大起了至關重要的作用。Kai Yu是國人中做DL的先驅(和如上幾位交集甚深，屬於一個圈內的人物)，某廠IDL的副廠長，一手帶動深度學習在某廠的很多領域得到應用，比如：影象檢索和理解、語音識別、Learning to Rank和廣告裡面的CTR prediction，也是國內DL的佈道者，將某廠的DL的知名度和影響面成功擴大到全球領域，帶動了國內DL的浪潮，可謂風頭一時無兩。

再說說現在深度神經網路的規模吧，最早Google的Distblief用了1000臺機器、16000核處理的網路規模大概是10億個神經元，而後Ng回了stanford之後，用了16臺CPU Server，每個server插4個GPU，總共是64個GPU(但是用了一個超牛逼的交換機叫做InfiniBand)，可訓練的網路規模是112億的神經元。確實，從效率、通訊、擴充套件性上來講，GPU甚至是CPU+GPU是趨勢，這也是Ng很快搞出一個網路規模更大、機器資源更省深度網路之後可以馬上宣稱"堆機器有什麼用，效率才是王道"的原因(這句話是我的杜撰，但是"Deep Learning with COTS HPC Systems"確實最後講明瞭這個工作的意義在於沒那麼多的機器照樣可以做大規模的深度網路)。最近看到的訊息，某廠的網路規模已經達到了200億的節點規模(這可能也是對Ng有吸引力的地方)，他們招攬了異構的專家搞異構計算，但總之GPU還是王道。下一步呢，我自己覺得目標將會是1000億的神經元的規模，因為深度學習的一路進展是在深度更深的背景是進行的，而且到了超大規模之後有可能能夠發現一些更加不一樣的東西，真能進入一片"不一樣的天空"也未可知。接下來就看google、facebook還是baidu誰先到這個地步了，因為規模越大，對並行架構、優化演算法(至少目前的aSgd基本不能work)提出前所未有的挑戰。

深度學習之江湖~那些大神們，不相信只有我一個人愛八卦

深度學習之江湖~那些大神們，不相信只有我一個人愛八卦

整理的最全大資料學習之路「大神必修課」

這陣子開始入門學習html標簽。下面是本人對標簽的筆記分享給平臺裏面的大神們。需要各位大神補充還有那些常用標簽。請留意指教感激不盡

詳解深度學習之經典網路架構（十）：九大框架彙總

我是一個新手小白，想學習C++程式設計，但是不知道該如何入手。請大神們給出一個簡單的思路。

葉梓老師開講0基礎學習人工智慧人工智慧之機器學習與深度學習-6術語辨析——大資料

深度學習之收斂問題

大神們幫忙啦

1.深度學習之安裝教程

深度學習之tensorflow （一）

深度學習之 seq2seq 進行英文到法文的翻譯

深度學習之圖片壓縮算法

Tensorflow深度學習之十二：基礎圖像處理之二

深度學習之 GRU 算法例子

深度學習之 TensorFlow（四）：卷積神經網絡

唐宇迪-機器學習/深度學習系列課程福利大發送！不單優惠還送機器學習必備實戰書籍！

深度學習之 DeepLearning4j 預測股市走向

劉國柱- Unity遊戲開發深度學習系列課程福利大放送

機器學習&深度學習之路

深度學習之神經網絡（CNN/RNN/GAN）算法原理+實戰

深度學習之江湖~那些大神們，不相信只有我一個人愛八卦

相關推薦