1. 程式人生 > >曾獲ACM世界冠軍,打造百度AI大腦,這位80後科學家要讓AI人人可用

曾獲ACM世界冠軍,打造百度AI大腦,這位80後科學家要讓AI人人可用

他是上海交通大學首屆ACM班畢業生,2005年在第29屆ACM總決賽奪得世界冠軍。在遷移學習領域,他的學術論文多次被國際頂級學術會議收錄,單篇論文引用排名世界第三。

研究生畢業後,他選擇加入百度,曾幫助百度建立起中國最大最成功的機器學習系統,成為T10級百度科學家

此後,他放下百度工作期間獲得的“巔峰”成績、加入華為,成為華為諾亞方舟實驗室主任科學家。從華為離開後,他創立 “第四正規化”,致力於降低使用人工智慧的門檻,讓更多企業享受到人工智慧的便利。

這個人就是第四方式創始人戴文淵。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

從小就是學霸

2005年,上海交通大學代表隊奪得第29屆ACM國際大學生程式設計競賽世界冠軍。戴文淵正是代表上海交大出戰的三名學生之一。在最後8分鐘,頂著落後對手一題的壓力,力挽狂瀾實現反超,戴文淵和交大ACM隊成功譜寫了傳奇。

然而鮮有人知,學生時代的戴文淵心理素質並不強大,他也是花了大工夫才克服了這一點。

他坦言,從小學就開始參加比賽,但經常會因為比賽時心態不佳而導致比賽名次並不如一些實力可能遜於自己的選手。但比得多了他慢慢發現,在比賽的時候最沒用的,就是去想比別人落後了幾道題。

“壓力並不能讓你做得更好,所以要學會選擇性忽視。”想通了這一點,戴文淵試著在比賽時說服自己 “選擇性去想什麼,不想什麼”,心中僅存獲勝的目標,排空任何雜念。這種超越比賽本身的訓練對他未來的人生有著深遠的影響。在創業面臨巨大壓力時,他已然能夠專注於當前的目標,不讓過多的焦慮壓垮自己。

640?wx_fmt=jpeg

除了心理素質的加強,戴文淵及他的團隊能夠奪冠的另一個原因要歸功於他們的師兄,林晨曦,帶給他們觀念上的轉變。

“他告訴我們,他過去很享受做出一題,又做出一題,但是後來興趣點變了,變成了享受贏比賽。” 而以“贏比賽”為目標導向,團隊合作所產生協同效應比單打獨鬥來得有效的多。

團隊中解題技巧最強的戴文淵也不再滿足於個人英雄主義,轉而成為隊友們的支持者。

他和隊友們住在同一個宿舍內,同步作息以訓練行動力的統一;他看隊友們愛看的漫畫來達成理解,他還確保那個喝了可樂小宇宙就會爆發的隊友隨時能喝到可樂——在長達一年的訓練期內,在某種程度上,戴文淵就像一個超級保姆。可正是這種謙遜隨和換來的默契,支撐著他們走上了冠軍的道路。

自ACM訓練時,戴文淵就懂得“以終為始,將目標拆解,然後逐步實現”的重要性,這也被他直接沿用到研究生階段的AI研究中。

當時,他的第一個小目標是發一篇論文,第二個目標是發更好的論文。

後來,當他幾乎把AI領域所有相關的核心期刊都發了一遍,他的第三個目標便是發更多的論文。“雖然現在看來挺俗的,但也是一個人成長的過程吧。”而如今,他正努力將科研成果應用於工業界,“下一步目標是做出真正有價值的東西,真正落地。都是一步步來的。”

結緣人工智慧

 十年前的AI絕非研究熱點,甚至是一個不被看好的領域。

而在AI的諸多研究方向中,最火的絕非遷移學習,而是凸優化(機器學習中的最優化問題)。比如參加學界會議,一半以上的人都在討論凸優化,就和現在一半以上的人都會在探討深度學習一樣。

而且,即便是深入多年的學者,自己也不相信基於這條路AI可以做出來。因為AI可以建出非常好的數學體系,卻沒有能力為它提供知識的內容。

戴文淵和AI意外結緣,是在大三。當時,他就讀於計算機系的首屆ACM實驗班,這個班的學生到了大三可以按個人喜好來選擇實驗室。那時最火的方向之一是圖形學(即CG,Computer Graphics),學好了也許能去闖蕩好萊塢。然而戴文淵的整個大三都在準備ACM競賽,等競賽結束熱門的專業早就選完了,只剩下AI。

“沒有人相信AI能做成。畢業以後,成績好的,能當個老師,成績不好,那就算白學了。”戴文淵調侃起當年的選擇,可他卻“因禍得福”,結識了人工智慧的堅定信仰者——香港科技大學楊強教授。

640?wx_fmt=png

作為一個目標導向的人,戴文淵承認自己有時會想著投機取巧,然而導師楊強卻始終是個走直線的人——我的目標是這個,我就這麼往前走;哪怕前面是個坑,掉下去,爬起來,再往前走。

無論外界對人工智慧是漠視還是追捧,這種郭靖式“耿直”的鑽研精神貫穿在楊強教授三十年如一日的研究中。

的確,選擇這種模式並不能使得每一步都會成功,然而拉長週期來看,“笨辦法”反而更紮實,能走得更遠。

“義無返顧地往前走就行了。”戴文淵感慨到,“他30年來就是這麼做的,並且他現在很成功。” 如今,在遷移學習領域,論文引用數世界排名第一的,正是楊強教授,同時他也是華人界首位國際人工智慧協會院士。

而戴文淵,憑藉10年前發表的一篇論文(Boosting for Transfer Learning),單篇論文引用排名世界第三。楊強對戴文淵的影響遠非僅僅停留在科研層面,更重要的是,他自身的堅定讓戴文淵看到了更大格局,有了更長遠的目光。

如今,戴文淵成立“第四正規化”,楊強也欣然成為了“第四正規化”的首席科學家,師徒二人並肩走在AI的取經路上。

獲得百度百萬美金獎

在戴文淵的職業生涯中,他做過幾件令人意象不到的事。2009年研究生畢業後,他放棄了讀博,轉而加入百度。而在當時,相比谷歌、微軟,當時的百度吸引力還比較有限。這樣一番選擇,用導師楊強的話說,是“需要非常大的勇氣的”。

05年的AI純粹是學術,而到了07、08年戴文淵看到了網際網路發展的趨勢。“不能再呆在實驗室裡了,因為形勢變化太快了,需要儘快找到一個場地,這個場地裡有足夠多的資料能讓我把我的研究真正利用起來。”

多年的積累和強大的判斷力,讓他意識到資料在AI這條路上的強大助力。用他自己的話說,“這時候一些大型網際網路公司,資料的累加對人工智慧會做的貢獻,開始比在學術圈做演算法的技巧,更有意義,會有最大的提升”。而他認為,當時國內只有百度符合條件,資料量足夠大到能讓他證明自己過去的研究能在產業界發揮作用。

和很多從實驗室去實業界的人不同,戴文淵仍然是帶著科學家的想法投身百度。

他把百度當作新的實驗室,並通過將深度學習應用於鳳巢廣告系統,為百度提升了約十個百分點的廣告質量,最終使得百度的變現能力提升了8倍,他所在的團隊也因此獲得了百萬美金的“百度最高獎”。

0?wx_fmt=jpeg

這是戴文淵第一次利用象牙塔內的“深度學習系統”創造出商業價值,同時也證明了AI可以“for someone”(特定的公司或組織)。這一令人欣喜的結果也讓戴文淵更有底氣相信,有可能進一步普及AI,實現AI “for everyone”(所有的公司或組織)。

對於未來願景的描述,戴文淵舉了一個形象的例子。“在100年前,只有非常專業的人才會使用照相機,也只有極少數的人能夠用。

現在,人人都能使用照相機是得益於技術的發展,但這不一定是成像技術的發展,而是照相機使用的門檻大大降低了。從傻瓜機到相機到手機的攝像頭,這之間是有著巨大的技術層面的飛越。

那就AI而言,現在我們看到Facebook、Google等公司在開源都相當於是在使用100年前的東西,目前我們只能等著他們或是BAT 把東西做出來了,然後用。但是怎麼把100年前的東西變成今天人人能使用的手機、照相機,就是我想做的事情。”

比起人們普遍擔心的未來AI會不會取代人類、控制人類的恐慌,戴文淵擔心的是AI有被科技巨頭公司掌控的趨勢。反其道行之,他要做的正是普及AI,降低使用AI的技術門檻,讓有建模、資料分析基礎的人能夠自如運用。

“從價值上說,總是需要有人來做這樣的事的。”依舊是照相機的例子,“100年前的照相師不順應時代的發展也就失業了。”戴文淵很清楚,與其守著自己的一技之長不如主動去創造價值,而且如果真的能為社會帶來很高的價值,根本不用擔心會沒有回報。

為了檢驗AI能否為更多家公司乃至全社會帶來價值,戴文淵做了第二個出人意料的決定——放棄百度T10級科學家這一鳳毛麟角的頭銜,自己出來創業。而在創業之前,他先去了華為取經,學習華為服務全世界的商業模式。

“管理3個人,我可以用在ACM隊的經驗,但是管理300甚至3000人,就不能按這樣軍事化管理的模式,我得學習如何讓更多人的潛能被激發出來。”如今,他創辦的“第四正規化”聚集了大批87、88後和90後,他發現只要是員工認同的事,大家就會願意為之奮鬥,而他要做的就是讓員工做得開心,讓他們感受到在為了一個巨集大的目標而努力。

0?wx_fmt=jpeg

雖然現在又多了一重企業管理者的身份,但戴文淵一直覺得,自己仍然是一名科學家, “我的性格是喜歡很安靜地研究世界的本質”。

探索世界本質的初心並沒有改變,只是為了更深入地研究並將科技的價值最大化地普及,他需要調動更多資源,並承擔更多責任。 


守正出奇

這個穿著格子襯衫、戴著黑框眼鏡的“理工男”,談吐娓娓溫和,目光堅定自信。談及自己走過的路,他的話不多,似乎一切都順理成章,正如他微博和微信上的簽名——守正出奇。

他堅定地研究人工智慧,無論是熱潮還是冷穴,此為“守正”;他放棄讀博,在百度默默無名時加入,如日中天時又選擇離開,自己創業,此為“出奇”。

每一個出人意料的選擇背後,不變的是做這些選擇的源動力,是他作為科學家的理想主義。

為了做更好的研究尋找更好多的資料,而為了找到更多的資料選擇更合適的環境,他從學術界再到工業界經歷了一次又一次轉型,但本質上還是在進行科學的探索,是在做著自己喜歡的事情。

把握好大方向,做自己應該做的,然後最重要的,把它做到最好,無論身處什麼樣的時代與環境,都值得我們學習。

推薦閱讀

長期招聘志願者

加入「AI從業者社群」請備註個人資訊

新增小雞微信  liulailiuwang

640?wx_fmt=png

相關推薦

ACM世界冠軍打造AI大腦80科學家AI人人可用

他是上海交通大學首屆ACM班畢業生,2005年在第29屆ACM總決賽奪得世界冠軍。在遷移學習領域,他的學術論文多次被國際頂級學術會議收錄,單篇論文引用排名世界第三。 研究生畢業後,他選擇加入百度,

【微信公眾平臺開發】利用接口制作一鍵導航功能

顯示 12px font -c cati blog ltr vertica 拾取 微信開發中,非常多商家用戶都要求點詳細地址。能在百度或者soso地圖上面顯示自己的地址。 而這種功能。利用百度api接口地圖標點功能就能夠非常easy實現。 1.功能說明例如以下:

雲盤資源引流的溫床你絕對值得擁有!

修改文件 ack 支付 nbsp 概率 和諧 核心 存在 興趣 百度雲,儲存只是階梯,引流才是核心。 影視,這玩意兒產量太猛,根本看不過來。於引流,影視資源效果,美麗非常。 昨天,一盆友說其因《興趣部落,又一個僻靜的馬桶,這次不再明日黃花

php獲取ios或android通過文件頭(header)傳過來的坐標通過接口獲取具體城市和地址並存入到session中。

word 請求 sse 百度 頭文件 reac session ray 位置 首先,在function.php方法文件中封裝一個獲取header頭文件的方法。 if (!function_exists(‘getallheaders‘)) {   function g

發現一波黒帽seo神操作通過打開跳廣告其他方式訪問正常。下面分析原理。

排名 javascrip 別人 訪問 廣告 簡單 方式 jsonp onload 朋友網站被黑了,但是不是低級黑,雖然最後發現原理很簡單,但是對於普通seo來說還是有些奇妙哦。而且不影響收錄和排名,站長只管優化,黒帽偷偷得利! 情況是在百度打開收錄的頁面,打開後,會跳到別人

使用html5獲取當前手機的經緯度並接入地圖API查詢出當前位置

api detail attribute spa rip coord component per bar 最近項目需要,稍微研究一下html5獲取當前地理位置的問題。 獲取當前位置的經緯度很簡單,一句代碼就搞定 [javascript] view plain cop

王海峰領銜研究院升級巨頭AI戰正式跨入下一幕

圈子 兩個 設立 歐美 前瞻性 切入點 圖片 實驗室系統 重要 年關歲末,各種各樣的總結和展望開始多了起來。這兩天的熱門話題之一,是BAT三家的AI布局統計和對比,各種各樣的文章都在從不同角度討論三家的優勢劣勢和各自特點,拼生態、拼場景、拼用戶心智,各種各樣的觀點蜂擁而來。

(轉)APP測試教福利:Appium 國內下載地址(雲盤已更新至 1.3.4.1)

monkey 語言 1.3 更新 follow zha install ast IT 鏈接是Appium相關安裝包下載地址(exe&dmg格式),如需自取:) 最新更新的是: appium-1.3.4.dmg& AppiumForWindows-1.3.4.

微信企業號開發:微信考勤地圖定位錯誤修正二

ipp ons AC 信息 解釋 企業號 android bsp ner 在之前的博客中微信企業號開發:微信考勤百度地圖定位,錯誤修正介紹了一種修正百度地圖錯誤的方法

達成戰略合作DuerOS和海爾U+平臺將如何加速AI+IoT行業?

百度 海爾 我們知道,AI作為一種底層技術泛指,需要長時間、多維度地逐漸走向產業化、應用化,最終才能真正來到人們身邊。很多人都好奇,2018年AI會以何種方式撬動市場增長,進一步推動技術與商業的結合呢?目前來看,百度等AI巨頭,正在積極嘗試通過AI+IoT的結合模式,以智能家庭場景為撬點,掀起新一輪的

自己寫的加密網頁網盤私密很相似需要密碼才能訪問(原創)

audio 查詢 數字 code 頁面 time AR 開發 其他 題記: 馬上就要招聘了,所以我打算放置簡歷在自己的網頁上,但是又不想給除了招聘的人,或者我指定的人外看,所以我需要對網頁頁面加密 我找了許多資料,查看了許多所謂的頁面加密,但是有60%左右都是網頁鎖,

地圖API展示地圖和添加控件

空間 鼠標滾輪 比例尺 鼠標 right size ofo ext aid 1、申請百度賬號和AK 點我申請 2、準備頁面 根據HTML標準,每一份HTML文檔都應該聲明正確的文檔類型,我們建議您使用最新的符合HTML5規範的文檔聲明: <!DOCTYPE html

python使用api實現復制截圖中的文字

content nsh AD con 讀取 __name__ return IT now() 百度雲文字識別技術文檔: https://cloud.baidu.com/doc/OCR/OCR-Python-SDK.html#.E6.96.B0.E5.BB.BAAipOcr

強勢入場AI們集體打 call:揭秘智能客服背後的語音技術與應用

一起 直接 net sap pac 上下 應用 class 例子 兩年前的今天,AI流行下圍棋;今天,AI流行打電話……這個潮流的最近一次上演,是幾天前的百度AI開發者大會上,李彥宏現場播放了百度AI客服邀請開發者的真實電話錄音。當時我就在現場,第一通電話裏那位開發者方言比

2018 年面試 Java 端的一次面試經歷

https 請求 遇到 net 簡歷 共享內存 targe 應對 部門 一,百度一面:### 1、給一個函數,返回 0 和 1,概率為 p 和 1-p,請你實現一個函數,使得返回 01 概率一樣。2、10 億個 url,每個 url 大小小於 56B,要求去重,內存 4G。

JavaScript--地圖定位可拖拽

event 控件 int pla location view api 事件 ont <html> <head> <meta http-equiv="Content-Type" content="text/html; char

地圖Androidv4_5_0.so

最近使用百度地圖實現了定位及檢視周邊活動的功能整理一下可用的資料。 一、位置監聽及縮放級別設定 /** * 定位SDK監聽函式 */ public class MyLocationListenner implements BDLocationList

speech_recognition實現錄音ffmpeg實現音訊檔案轉換並用語音的sdk實現語音識別

專案說明: 在windows平臺下,使用speech_recognition記錄音訊,並轉換為16k的wav, 之後利用ffmpeg將wav轉化為pcm檔案,上傳到百度語音端,返回語音資訊,並利用pyttsx3添加了簡單的互動功能。 需求模組: speech_recognit

python3 學習 3:python爬蟲之爬取動態載入的圖片圖片為例

轉: https://blog.csdn.net/qq_32166627/article/details/60882964 前言: 前面我們爬取圖片的網站都是靜態的,在頁面中右鍵檢視原始碼就能看到網頁中圖片的位置。這樣我們用requests庫得到頁面原始碼後,再用bs4庫解析標籤即可儲存圖片

文庫網站開發文庫網站定製仿線上文件網站建設

專業定製仿百度文庫網站系統,文庫網站系統原始碼,文庫‌‌‌‌網站建設開發,支援電腦版+手機版+微信版+小程式版+APP版,由10年的技術團隊專業定製,需要的朋友可以聯絡我們。 網站採用:PHP+MySQL+thinkPHP框架(可定製) 支援doc、docx 、ppt、 pptx、 xls、 xls