1. 程式人生 > >【人工智慧】AI系統架構師:AI領域真正最缺的人才是會庖丁解牛的那個人

【人工智慧】AI系統架構師:AI領域真正最缺的人才是會庖丁解牛的那個人

來源: AI科技大本營 授權 產業智慧官 轉載

圖片來源:Wired

【AI科技大本營導讀】這裡,就不賣關子了。AI領域最最最最最稀缺的人才應該為人工智慧架構師。有過4次技術創業經歷,如今做AI投資的星瀚資本創始合夥人楊歌如是說。

在楊歌的身上,傳奇的經歷多得是。

清華學霸,技術男,四次技術創業經歷,建立青年精英商業聯合會,投身PE,創辦星瀚資本,圈內最懂AI技術的投資人之一......

然而,最打動我的,並非這些光鮮的字眼,而是他身上強大的勢能,他眼裡的平靜和堅定,以及他完全不Care年輕時賺錢這件事。當年,他甘願拿很少的工資,只為去四大會計師事務所惡補財務知識。他賺的第一桶金,想都不想,直接扔到公司。他壓根就不理尋常的那一套活法。

他喜歡用數學模型和物理模型來比喻和解釋身邊的一切現象,喜歡用元認知來節省大腦記憶體,喜歡用一二三來條分縷析。他的語速很快,很少停頓,且無廢話,幾乎可以直接成稿。

採訪中,他對於三個問題的論述,讓我尤其印象深刻。

第一,對目前AI晶片的立體式解析(終於知道AI晶片到底為什麼會火了);

第二,對於AI市場稀缺人才AI架構師的三個層次解析(技術追求者必讀哲學);

第三,對於AI類或一般程式設計師選擇創業的建議,針對三大特徵需要補足的短板,並對此提出的四大方法(工程師創業,請詳讀)

楊哥很喜歡用簡單的語言,把複雜的道理講清楚。每一個問題,他都能細到不能再細,深到不能再深,再結合各類比喻,確保你真正聽懂了他的意思。

本文較長,總共分三個部分,價值含量相當高。文中儘可能地保留楊歌的口語,以原汁原味地呈現他的智慧。希望對你有所啟發。

作者 | 鴿子

就在AI專用晶片在市場上的呼聲不斷被推向新高的當下,作為投資人的楊歌也出手了,一舉投資鯤雲科技。在看AI技術有關的創業中,楊歌在圈內頗有名聲,且語言表達能力極強。正好借採訪之際,讓他用最直白的語言給抖明白,專用晶片到底一個怎樣的存在,到底應該怎麼理解現在市場的晶片,以及AI晶片的創業者們,到底需要比拼些啥?

以下采用第一人稱口述的形式,呈現三個部分內容:

  • AI晶片為何突然火了?

  • AI領域真正最最最缺的人才到底是什麼?

  • AI工程師如果選擇創業,必須補足哪些功課?

01

AI晶片為何突然火了?

細數晶片的歷史,就是一個從專用晶片轉向通用晶片,又轉為專用晶片的過程。

最早追溯到上世紀60年代,Intel從專用晶片轉向通用型晶片中央處理器(CPU),英偉達轉成GPU,這兩年又產生了TPU。

這個整套體系都是一個把晶片越做越普世化的過程,但這兩年由於終端要降低成本,所以又要返回到專用晶片,因為通用晶片相對來說,效率比較低,製作成本比較高。

所以,這兩年專用晶片開始火起來。

從通用型的、伺服器型的、整合型的晶片,轉成專用型的,部分裝置使用的,有一定功能的晶片,再加上這兩年正好趕上AI大爆發,大家就很自然地把AI的需求燒製到這些晶片裡,也就是我們看到的AI晶片異軍突起。

為何終端場景會催生專用晶片?

終端的場景為什麼一定要用終端晶片,而不能通過一個捕捉器做網路傳輸送到雲端、送到伺服器端,用伺服器的CPU、或GPU、或TPU去處理,然後再返回資料呢?

是因為你的網路無論多快,中間都有幾百毫秒的時間差,而終端晶片未來都需要做到當機立斷、直接分析。

比如一個機器人,它看到你之後,需要迅速分析出你有什麼特點,並跟你對話。這個過程中,如果機器人只有接收器,需要傳送到雲端再回來,無論網路多快,都會有時間差。

所以,為了提高響應速度,終端開始催生自帶處理器的需求,比如能做影象識別、語義識別、語音識別,運動機能的一些處理等,那麼這個時候,終端就需要具備一定的人工智慧能力(AI能力)。

專用晶片起勢後,玩家們到底比拼什麼?

當專用晶片這個需求起來之後,玩家們就要開始比拼了,具體來說,比的是:

第一,你的硬體結構是不是最優。

硬體行業的特點是:沒有最優、只有更優。

硬體永遠都在迭代,背後的原因,主要是摩爾定律在起作用。此外,當摩爾定律電晶體變成量子化的東西后,它會繼續進化,從分子層面進到原子內部層面,再繼續找其它的計算位。

第二,演算法是不是最優。

前兩年大家非常痴狂的去搞神經網路演算法的時候,變體非常多,從最開始簡算的RNN變到LSTM,變到更為複雜的結構,從最開始設計CNN,到CNN的複雜結構,再到用CNN做對抗網路…

在大家瘋狂競爭演算法的時候,2017年又出來一個理論說:神經元的基礎單元不應該是神經,而應該是一個膠囊;這樣一來,演算法底層又改了,Hinton先生把自己30年前的學術成果給推翻了。在Capsule  Network中,in&out在單個處理單元上變得更復雜,雖然網路連線過程還是原來的樣子。

所以,很多人又只能整個推翻,重來。

第三,工程細節是不是最優。

人們也發明了很多種方法,比如原來是全連線的,後來又有CNN部分模組連線,然後又出現了很多類似Dropout的模式,連線著同時遺忘著,發現比正常的還更好。

第四,工程上的創新每天都在發生。

每個工程師都有工程上的創新。100個工程師裡如果有一個工程師有了意義深遠的創新,那麼對於整個行業來說,又是一場大變革。

無論是怎樣的創新,都在不斷突破,不斷提升效率。比如,在演算法上,AlphaGoMaster和AlphaGo  Zero,後者的效率相對前者就有突飛猛進的增長。

所以,一旦底層被改變,一切又變得不一樣了,又得迭代。比如,原來可能是20秒解決,你能19.8秒解決;但現在,突然底層一變,你變成10秒解決了,就又是一層迭代了。

沒辦法,這個行業就是這樣。

從硬體、軟硬結合,軟體、演算法幾個方面來看,每天都在迭代,所以它很難:由於它沒有定型,無定型態的結果導致對專用晶片的固定性要求是非常苛刻的。

因為專用晶片很大的問題是一旦定板、開模,這個東西就不能改,這是一個很大的問題。所以,如何做一個適用性最強的專用晶片,這是非常重要的。一般的專用晶片做完之後,比如只服務於某一種語音識別機的晶片,一旦演算法更新,底層對模組的要求就又不一樣了,那麼這個專用晶片就不能用了。於是,只能再做一個新的專用晶片。

這個事情的迭代速度太快了。

晶片的三種類型

前面大致羅列了專用晶片崛起的背景,接下來我們具體聊一下晶片到底有哪三種類型:

  • 整合型的晶片(CPU、GPU、TPU),屬於它的模組陣列非常統一的,它能處理幾乎所有的事情,又叫通用型晶片

  • FPGA可程式設計門陣列

  • 專用晶片

其中,FPGA相當於編寫硬體,通過改變硬體可以隨時調整功能邏輯,但FPGA有以下幾個大問題:

  • 成本比較高,真正好的FPGA要8000元-1萬元。

  • 編寫複雜,門檻高,修改難度大。

  • 程式設計過程中的效率比高階演算法低,這樣就導致開發難度也比較大。

所以,FPGA是個過渡過程,它能夠銜接通用型晶片和底層專用晶片。

說完FPGA,再說說專用晶片。

專用晶片的特點是價格極其便宜,只要你開模、打板之後,基本上一片50-100元就搞定了,但開模費500萬,而且一旦開模就改不了。(營長注:這裡500萬為概數,楊歌想表達是開模費很高,對公司來說,是一筆不小的負擔。據營長所知,開模費的量級一般在數百萬-數千萬之間。)

如果用數學的方式來理解這三類晶片,那就是:

  • 專用晶片又叫階躍函式,意思就是,這個東西開了模之後,下一次你要再改,你就得整個上一等;

  • FPGA是線性函式,慢慢漲、慢慢漲;

  • CPU、GPU等整合型晶片是指數函式,成本高,但它是一個好的模式。

專用晶片的成敗關鍵

目前,大家傾向於迴歸專用晶片,這也是因為專用晶片在2017年有兩大推動力:比特幣的挖礦機人工智慧

基於這兩股力量,編寫專用晶片需求來了,因為FPGA和CPU成本太高了。

但專用晶片的問題也來了,那就是,無論哪個時代,不管你是20世紀70、80年代,還是現在,專用晶片都會有過時的一天,因為技術一直在迭代。這時候,就是考驗你對專用晶片把控力的時候了,一句話,你設計的專用晶片到底能支撐業務走多久。

如果你編出來的專用晶片,能持續三年使用,那麼同期你就可以去研發另外更新的專用晶片。三年後,當原來的專用晶片產能要下降的時候,你可以拿新的專用晶片頂上。你要能頂上,那這個能力就厲害了。

但如果你的專用晶片半年就過時了,那你的成本就太高了,因為你每個專用晶片的打板就需要500萬以上,對初創公司來講是完全承受不起的。(營長注:此為概數,只是為強調打板花費較大。)如果你還不停地在打板,那你的公司就危險了,你還不如用FPGA和CPU來做,現在多核CPU也能完成。

現在專用晶片的一個競爭在於,你編寫出來專用晶片是否魯棒性、適應性和存續性足夠強,是否能夠適應更多的人工智慧演算法模組,是否能扛住演算法變體…

比如當CNN一變體,卷積核一變體,這個晶片能不能扛住?當LSTM的迴圈網路內部結構中,忘記門和記憶門這兩個發生變化,你能否扛住?

當然,Capsule  Network一出來,不僅你扛不住了,大家都扛不住了。

總的來說,你要讓你的專用晶片在容錯性和魯棒性、適應性上做到最強,這樣,你的成本才能算得過賬來。但大部分技術人員的賬,可能算不了三到五年的時間。

還有些人把目光放在非常細的地方,一定要編到極致,保證區域性的魯棒性、容錯性提到最高,但長期的、中長期,比如三年期,這樣不一定行。

比如,在交通影象監察識別上,你怎麼用都不出錯,正確率99.9%,但突然過兩年演算法一升級,你怎麼辦?

因此,我不建議把目光放到單個場景的適應性上,我認為應該放在一個長期的、場景變革的使用性上,這點非常重要。

這些問題其實是現在AI晶片競爭最重要的底層邏輯。在AI晶片領域,我們投了鯤雲科技,他們的聯合創始人為斯坦福的客座教授、帝國理工的教授、英國皇家工程院院士,發表300多篇的論文。

他們的特點能把晶片的適用性做得很好,晶片的場景適應性、網路適應性、演算法適應性非常強。

同樣做的很好的公司還有地平線、寒武紀、深鑑等,不過也有一些公司,場景化的正確率只有95%,甚至85%,那麼這些晶片可能就沒法用,或者只能調動一定的模組函式,不能調動大部分模組函式。

目前來說,深度學習訓練過程是不需要用AI專用晶片的,因為AI專用晶片主要還是在某一個終端應用場景用。一般來說,終端人工智慧晶片並不執行訓練過程,它只執行使用過程。這是大家容易產生理解誤區的一個點。

AI晶片市場距離飽和還很遠

說到終端市場,英偉達也在猛攻終端市場。英偉達去年出了一個TX2的新型晶片(也是終端晶片)。但英偉達的終端晶片是一個輕版的整合化晶片,是把它整合化的GPU鑲在了一個小的晶片上,形式了一個專用晶片。所以,現在的AI專用晶片還需要扛住英偉達的競爭。

目前,人工智慧技術有三層:

  • 基礎數學物理層

  • 技術模組中間層

  • 應用層

技術模組中間層(簡稱模組層)是指影象識別、語言識別、語義識別、運動機能識別;底層,即基礎數學物理層,就是晶片,資料傳輸、資料儲存結構、演算法結構、演算法模組。

而應用層中,幾個比較大的場景有:

  • 智慧傢俱、智慧房屋、智慧城市

  • 機器人

  • 個人語音助手

這幾個場景的入口模組都需要完整的、完全標準的模組層,就是說語音識別、語義識別都則需要非常精準,無論是器械,還是一個機器人,都需要模組層要很成熟,同時需要底層晶片層很成熟。目前,大家都在競爭這個市場。

二十年後,周