1. 程式人生 > >為什麽相比芯片,我們更在意深度學習框架的中國化?

為什麽相比芯片,我們更在意深度學習框架的中國化?

開發平臺

這兩天美國宣布對中興進行封鎖,可謂在科技圈掀起了從上到下的一股龍卷風。

4月16日美國商務部發布命令,禁止美國企業向中興通訊銷售元器件,時間長達7年。假如這一紙禁令真正生效,意味著中興通訊旗下全產業鏈所依靠的芯片等核心元件失去獲取渠道,基本意味著龐大的中興通訊將面臨無法繼續經營的最壞可能。

中興通訊股價隨之快速下跌,已相當於兩個跌停板,其美國供應商的股價在“禁令”發布後也遭遇不同程度的下跌。

19日,中國商務部新聞發言人高峰在新聞發布會上表示,美方行徑引起了市場對於美國貿易和投資環境的普遍擔憂。

隨著中美貿易戰延伸到科技領域,似乎一夜間我們又回憶起了缺失核心研發能力的恐懼。“缺芯之痛”轉瞬彌漫在輿論氛圍裏,甚至關於“中國科技到底行不行”的討論又一次塵囂直上。

技術分享圖片

當然了,出問題就無限誇大其實並沒有太大意義。客觀來說,美國的芯片禁令無法持久,畢竟這背後涉及的美國本土產業鏈、利益群落與工作崗位非常龐大。一旦接連失去中國大客戶,美國引以為傲的科技產業本身就會撐不住。

另外我們需要認清的是,半導體行業今天的國際格局並不是幾個月,甚至幾年內造成的。而是整個半導體工業時代發展和遺留下來的產物。中國以及全世界更多市場的計算機、工業、通用電子系統上本土芯片占有率都是零。

事實上,中興這樣的中國企業,在技術上的銳意進取是有目共睹的。但芯片研發制造能力的國際壟斷,是幾十年積累下來的產業現實,是大量的科技因素與市場封鎖、貿易規則制定綜合得出的結論。是一兩家公司,甚至是集合整個科技集群都難以改變的。

換句話說,中國科技公司面臨可能出現的困境,除了加強研發投入也沒有什麽別的辦法。過去我們無法改寫,但今天我們能改變的東西,叫做未來。

技術分享圖片

就像幾十年前的半導體技術是核心中的核心。今天提起能改變未來世界的技術,AI絕對是當仁不讓。尤其值得註意的是,這個剛剛興起、充滿變化的技術領域裏,中美之間的價值突圍和技術博弈其實更加激烈。

AI的國家戰略重要性是毋庸質疑的,而針對產業鏈上遊核心技術的爭奪正在逐步呈現白熱化。假如我們希望若幹年後整個產業界,甚至整個國家不會再因為一紙封鎖領而恐慌,那麽AI這個戰場的基礎設施,才是真的不容有失。

或許對於大部分人來說,AI的底層之爭在今天還有些陌生,但它確實很可能像曾經的半導體一樣,產生新時代的世界科技格局壟斷效應。比如說每個AI開發者都會用到,所有AI應用產生的基礎——深度學習開發框架。

在這個普通人很陌生的領域,中國科技公司和萬千開發者,正在一點點刷新著中國科技的存在感。

被忽略的深度學習框架

芯片為什麽重要?原因在於它是一切運算的基礎,是最後端的的東西,沒有它一切硬件都玩不轉。所以當壟斷形成,就能對其他經濟體的科技發展形成底層制約。

同樣的道理,在AI時代也體現在開發框架這件事上。我們知道,AI開發者不能每開發一個模型就從最底層重新來過,所以想要進行算法訓練、模型開發、應用部署,都必須在一定的開發平臺上來完成。AI發展到今天,這個平臺的角色主要依靠大學和企業提供的深度學習框架來扮演。

在中國,深度學習框架相對來說是一個科研和開發領域的事情,但在美國,產業界圍繞開發框架的爭奪戰早已經火星四溢。

比如說,很多美國媒體都認為,谷歌今天在雲計算、硬件、語音助手、AI教學等業務中,全都展現出“TensorFlow First”的特點,用盡各種辦法將開發者引導至自己的開發平臺上,並且堅決不兼容其他開發框架。

技術分享圖片

而Facebook、微軟則對TensorFlow的封閉深惡痛絕,形成了以caffe、Python結盟形式的“反谷歌聯盟”,希望以兼容性和社群開放等優勢,打破谷歌一騎絕塵的戰略格局。

對開發框架的重視,隱藏著科技企業和背後國家經濟體對AI未來的押註。試想無數應用都在自己的平臺上進行開發,那麽所有數據、算法創新和模型訓練過程就都留在了平臺當中。企業和平臺收獲的,是作為地基的產業地位。而國家經濟收獲的,是可以從源頭上控制其他經濟體AI應用的“上遊效應”。

幸運的是,已經吃夠了“下遊之苦”的中國,在深度學習框架這件事上並沒有落後。

技術分享圖片

為了解決當時主流開發框架僅支持但GPU應用,無法進行大規模數據處理的問題。百度從2013年就開始研發自己的深度學習框架PaddlePaddle,經過長期內部應用後,在2016年正式將其進行開源。

這也讓百度成為繼谷歌、Facebook、IBM之後,全球第四家、中國第一家開源深度學習開發框架的科技公司,從而讓中國在這個關鍵領域沒有陷入長期滯後。百度之後,國內的其他相關企業也紛紛在框架上展現動作,在AI之爭可能打響的前夜,中國產業壁壘的高度已和過去不再相同。

可能出現的中美AI對決中,開發框架或是軸心武器

就目前中國AI的整體行業氛圍而言,似乎普遍更關註AI“用”的一面,容易忽略在應用之前的開發與創新,以及為創新提供的基礎設施,是整個AI商業想象力的原點。

事實上,假如我們將中美兩國看做處於競比關系的兩個AI技術群落,那麽深度學習框架的質量和接受度,很可能會影響到整個產業競賽的進程甚至結果。

技術分享圖片

或許可以從三個角度,來看為什麽中國一定要有自己的深度學習框架,以及中國開發者為何更應該支持“國貨”。

1. 中國AI無法離開中文:我們知道,AI的一個重要領域是語言與對話的交互。那麽未來在中國市場應用的,必然是基於中文的AI開發。但在NLP與語音交互、神經網絡翻譯等技術上,國外主流開發框架很少有中文數據集,也缺乏在中文領域的技術探索。如今來看,開發者想要開展這方面的工作,幾乎必須依賴PaddlePaddle這樣的國產框架所提供的開發基礎和數據集、文檔。

2. 產業鏈的安全風險:去年,谷歌的TensorFlow曾經被爆出重大安全漏洞。雖然沒有造成實質影響,但當時專家評估,類似的漏洞完全可以影響甚至摧毀所有基於該平臺開發出的AI模型。要知道AI大量涉及安防、識別、城市交通、公共服務等國家事務核心領域應用,這些應用如果在國外框架中開發運行,那麽安全風險不言而喻。這個層面來看,百度開源PaddlePaddle這類的舉措,也是在AI與國家科技安全提供了更妥善的解決方案。

3. 產業應用需求不同:相比於美國,中國對AI開發這件事的需求其實有很大不同。比如說傳統企業多、開發者的應用需求大、商業期待迫切、開發人才處在發展階段。那麽相比於前沿探索類的開發,中國開發者更需要在開發框架提供高效、靈活的開發方案,以及快速部署、彈性學習的能力。這些因素當然是遠在天邊的歐美開發平臺不會考慮的,比如偏底層考慮的TensorFlow,就需要開發者考慮大量細碎問題,但PaddlePaddle就更偏重於高層開發,強調開發者可以盡快投入應用。顯然,只有類似百度這樣深諳中國開發者需求和中國AI市場生態環境的企業,才會進行針對性價值提供。

不難看出,基於應用性、安全性和中文開發的必然性,中國開發者都應該選擇“支持國貨”,而PaddlePaddle也可以說是目前最符合中國開發者需要和國情真實境況的開發框架。

但是有個問題要搞清楚:說一千道一萬,國貨必須足夠優質才能讓開發者支持。好在,今天來看PaddlePaddle等平臺並沒有讓我們的愛國之心失望。

“國框”的進擊:從PaddlePaddle到中國AI並未缺席

確實在科技領域,“理性支持國貨”顯得尤為重要。畢竟不能為一些大局層面的考慮,犧牲貨真價實的成本與效率。好在從PaddlePaddle今天的成績來看,“國框”已經在很多層面上足可與歐美一較高下。

Caffe 的創始人賈楊清在評價PaddlePaddle時,也認同其在簡潔、靈活、快速等領域功力不俗,並且解決了Caffe早期的不少遺留問題。從技術邏輯到開發者的應用價值上,我們可以分為三層來評價PaddlePaddle的特點。

技術分享圖片

首先需要看到的是,在開發者需求的核心特性上PaddlePaddle已不落後:比如說PaddlePaddle的快捷流暢一直飽受好評,在RNN算法上其速度比主流框架快1-2倍,而且占用的顯存資源更少。

另外PaddlePaddle最開始就是為了解決大規模集群計算問題而生。所以相比TensorFlow來說,能給予開發者更多的可伸縮性與靈活性。比如其支持多種集群框架,可實現GPU集群資源的動態分配。這樣開發者會更快上手,更加容易貼近模型的應用化。

其次,我們可以看到PaddlePaddle已經帶來了一些功能上的獨特創新。在AI開發的世界,沒有點絕招顯然是不好出來混的,畢竟開發大牛們的眼光那叫一個挑剔。在強敵環伺的開發叢林裏,功能獨創性確實很難,但好在“國框”已經有了進展。

比如說PaddlePaddle的最新版本fluid中,開發過程更加接近高級語言。這就保證了開發過程的透明化和可控,從而有效抵消了深度學習開發過程中的“黑箱問題”。讓開發者不再模模糊糊做開發,這個能力是今天主流框架共同爭奪的,但PaddlePaddle已經不落人後。再比如說PaddlePaddle支持彈性的使用計算資源來完成深度學習訓練,根據計算需求來調節資源使用,這就節省了開發者的大量成本。

技術分享圖片

再有一個,也要看到今天的開發框架之爭絕對不僅僅是框架內部的技術矛盾。更多時候開發者要看重平臺的生態性、應用度以及商業前景。比如谷歌讓Facebook等公司忌憚的,其實是整個谷歌AI產業封閉起來的排他特征。

而在生態與商業價值層面,百度顯然給開發者提供了足夠優質的選擇。圍繞PaddlePaddle,百度正在幾個領域搭建與開發者的緊密合作網絡,為硬件、無人駕駛、智能服務等主要市場實時註入發展動力。並且不斷輸出新的AI開發者培植方案,同時為開發者提供了快速進入商業世界的通道。

綜上所述,今天“國框”已經不能說是為了愛國而愛國的強硬選擇。在很多層面上,AI開發的自主、自有、自生態,已經可以在中國這個世界第二大AI技術實體與市場獨立完成。也許我們並沒有想要爭奪什麽,但沖出技術封鎖,可以說是一切關於未來想象的前提。

結束語:別是一風景

或許對於中美貿易戰,以及可能的科技禁運等情況,我們還是有些過於敏感了。

誠然,硬件和底層技術有差距,是必須要承認的事實;但在新的領域,在爭奪未來的原點上,中國科技工作者、開發者以及無數企業,一直都沒有停止奔跑。中美之間的差距,今天也在以肉眼可見的速度縮小。

對待中美科技之爭,更合理的方式或許是承認差距的同時,認清很多關鍵領域本土的並不比國外差。

沒有必要盲信,但也沒有必要盲目悲觀。國家自信這件事,在科技領域從來沒有比今天更真實過。

堅定支持國家和產業打造技術核心競爭力;開發者、資本和平臺有效組織產業聚合;營造更好的創新土壤,那麽中國終有一天不會再被人牽著鼻子走。

星河流轉之後,或許別是一風景。


為什麽相比芯片,我們更在意深度學習框架的中國化?