facebook的“硬體開源”啟示錄
圖片來源@視覺中國
文|腦極體
facebook與硬體“相愛相殺”的故事大家恐怕聽到耳朵起繭了。不過,前不久facebook在開放計算專案(OCP)峰會上官宣的新硬體開源專案,依然引起不小的關注。
不僅因為這是個“組合大禮包”,包括了面向訓練的Zion、面向推理的Kings Canyon及面向視訊轉碼的Mount Shasta。更重要的是,這是facebook首次明確地表達出了從消費硬體到基礎設施的轉型姿態。
這張升級後的硬體“名片”,被加上了“產業基礎架構”幾個大字,之於facebook自然意義重大。不過,它也並不那麼突出,因為谷歌、IBM、蘋果等在內的巨頭們也相繼加入了硬體開源的大軍,有的甚至比facebook還早。一場與智慧基礎硬體有關的戰意,似乎在這個春天悄然而至。
我們不妨以這次大動作為切入點,看看facebook能否藉著2.0版硬體夢一戰翻身?

AI三件套:facebook的2.0版硬體夢
先來了解一下,facebook究竟放出了哪些讓業界為之震動的“下一代”神器。一句話總結,就是針對深度神經網路運算的“基礎設施三件套”,可以為中小企業的AI夢供能。其中主要包括了三個模組:
1. 能夠進行大規模神經網路計算的訓練平臺Zion
Zion採用了facebook全新的OAM模組(OCP Accelerator Module),能夠高效處理包括CNN、LSTM和SparseNN在內的一系列神經網路。配有兩個高速結構,能夠有效地使用可用的聚合記憶體容量,使得更頻繁訪問的資料駐留在加速器上,而訪問頻率較低的資料駐留在帶CPU的DDR記憶體。從而為合作伙伴(目前有AMD、Haban、GraphCore和NVIDIA等)提供高容量高頻寬的儲存、靈活且高速的互連,以及強大的計算能力。
2. 能夠執行推理任務的AI伺服器Kings Canyon
和傳統的CPU伺服器不同,facebook開源的AI伺服器由M.2 Kings Canyon加速器和連線到Twin Lakes伺服器的Glacier Point v2載卡組成。其中,每個Kings Canyon模組包含了能夠執行INT8半精度運算的推理ASIC晶片和其它支援元件,可以通過專門的編譯器將圖形轉換為可以在這些加速器上執行的指令,從而不受供應商特定硬體的限制,為機器學習加速器生成高度優化的程式碼。
3. 可以定製轉碼的Mount Shasta
視訊是facebook的核心業務之一,每天大約有7500萬人訪問相關產品。為此,facebook為不同的網路環境劃分了多種解析度和位元率的輸出質量,這就是視訊轉碼。
而其開源硬體Mount Shasta,就是一個由多個GPv2組成的高密度幾何體,每塊Glacier Point v2(GPv2)載卡都安裝了能夠高效輸出視訊編碼的ASIC,這樣就可以將視訊轉碼工作負載平衡分佈到不同資料中心位置的異構硬體上。facebook還配備了通用的介面和框架,以便於各種機器學習和視訊空間供應商的能夠順滑使用。
總體來看,Zion、Kings Canyon和Mount Shasta這“AI硬體三劍客”,劍指當前爆發式增長的AI訓練、AI推理和視訊轉碼方面的需求,並試圖將facebook長期以來積累的技術優勢和硬體招牌相結合,以開放的姿態,打造出一塊能夠影響未來產業結構的“金字招牌”。
facebook為何對硬體如此執著?
屢敗屢戰:facebook熊熊燃燒的硬體之魂
facebook和扎克伯格一直對硬體愛得深沉。其硬體的發展之路也執著地經歷了三個歷史階段:
階段一:與谷歌打擂臺的伺服器之爭
早在2009年,facebook就以“又一個谷歌”為目標,開啟了一場關於硬體的擂臺賽。從Google挖來了硬體工程師Amir Michael,主管硬體設計。2010年,又成立了第一個自建資料中心。
2011年4月,facebook發起了開放計算專案(Open Compute Project,OCP),開源了其包括資料中心、定製伺服器在內的一系列硬體設計。
作為一個開源的硬體專案,OCP成為facebook向硬體廠商和社群化運營的關鍵載體。但隨著在移動雲時代的逐漸掉隊,facebook只好將目光轉移到了消費硬體上,以挽救華爾街投資人日益流失的心。
階段二:押注消費硬體的社交時代
硬體+社交,成為2014-2018年facebook“自我拯救”的兩大核心關鍵詞。
2014年,facebook以20億美元的價格收購虛擬現實頭戴裝置製造商Oculus,開啟了“軟體向下整合”製造業的里程。
2016年,成立了Building 8部門和裝置陣容強大的“Area 404”硬體實驗室,讓自家多個部門的硬體工程師聚集在一起放飛自我,以共同催化facebook的硬體計劃。
不過,最早與大眾見面的,居然是2017年跟風發布的一款帶有碩大觸控屏的智慧音箱“Portal”,當時被群嘲為“幫筆記本螢幕存貨清庫存”,隨後又遭遇了收集使用者隱私的指控。
在隱私形式更加嚴峻的2018年,facebook又執著地釋出了內建攝像頭和麥克風的硬體產品Portal及Portal Plus,使用者可以在上面通過社交賬號進行視訊聊天。從市場的反饋來看,顯然是不及格。
階段三:伸向AI的硬體觸角
消費硬體雖然步履維艱,但忙著“帶貨”的同時,facebook也沒忘記自己的技術使命,開啟了向AI大潮的堅定轉型,將AI研究應用於facebook的既有產品上。
不過,扎克伯克宣佈進入智慧領域的時候,其實已經晚了。當時,谷歌已經將深度學習應用於多個業務線,微軟更是雄踞近千名科學家和工程師,亞馬遜暗自研究AI已有4年之久,中國的百度更是剛剛挖走了谷歌的深度學習領頭人Andrew Ng。
“趕了個晚集”的facebook,除了在現有業務上加速上馬AI 之外(成立了FAIR和AML),自然也選擇了兩條腿走路,跟硬體死磕到底。
2015年,facebook開源了自己的人工智慧硬體伺服器“Big Sur”,該伺服器包含了8個影象處理單元,可以執行最新的人工智慧演算法,供程式猿們免費使用。此後還不間斷地在GitHub這樣的開源服務上發表程式碼,狂刷AI人設。
隨著今年這一通“硬體開源大禮包”的騷操作,facebook的“硬體拯救”計劃終於不再是一件強行穿上的“皇帝新衣”,而是為自己重新定位了一個新座標:智慧基礎設施服務商。
硬體開源2.0,對於facebook有何意義
那麼,這張2.0版本的“硬體名片”,對facebook來說究竟意味著什麼?或許我們可以從三個角度來找到答案:
1. 自身AI技術的“軟著陸”。
當前環境下,深度神經網路的技術門檻、應用場景和稀缺的算力資源,都在制約著開發者的手腳。其中支撐AI基礎設施的就是開放硬體技術。
而對於facebook來說,其機器學習系統每天要處理超過200萬億次的預測和50億次的翻譯,積累了領先性的技術優勢和應用場景,將這些產業資源(包括資料、工具、框架、硬體等)整合,並通過開源的形式共享出來,能夠幫助整個AI產業鏈造就更有持續生命力的開發環境,降低開發成本,既是facebook作為巨頭的責任,也是其技術優勢在產業鏈的“軟著陸”。
2. 提升智慧基礎架構的產業競爭力
谷歌、亞馬遜、蘋果等已經在AI基礎架構領域火力全開,圍繞AI晶片、專用處理器展開鏖戰,facebook想要“後來居上”提高競爭力,開源自然迫在眉睫。
一是有更多的企業使用facebook統一規範的硬體,可以增大采購量,幫助facebook降低成本。正如facebook AI領域的建立者 Yann LeCun所說,“越多的人使用這項技術,它的成本就會變得越低。”另一方面,開源則可以吸引外部人才參與專案協作,並改進相關技術。減少自身科研經費壓力的同時,還有可能從第三方社群中招募一些人才。這些都是AI這場“圈地戰爭”的關鍵賽點。
3. 埋藏著金礦的生態叢集
AI的未來也必然需要一個集合了全球優秀開發者的龐大叢集,開源恰恰就是爭奪生態資源的最好辦法。以安卓為例,由於開源,谷歌建立了強大的開發者社群,才有了手機市場的大半壁江山。
通過為開發者們注入基礎的技術、硬體和生態能力,後續的產業融合和廣告效應才是科技巨頭們所期望看到的。為了在“後發”的AI基礎設施領域迅速縮小與谷歌、IBM等的差距,facebook通過開源壯大自身生態系統,自然也就迫在眉睫。
綜合這三方面來看,facebook的“硬體2.0計劃”,既是水到渠成,也是因勢利導的明智之舉。對於眾多AI開發者和企業來說,也確實是個福音。新的硬體解決方案和更強大的算力資源,很大程度上降低了機器學習訓練的工作量,也將給AI的商業化步伐帶來新的想象空間。
不過,需要正視的是,升級版硬體開源,或許能讓facebook在AI領域贏得聲譽和民心,卻未必能保證實現扎克伯格“硬體求生”的戰略雄心。
首先,硬體畢竟是通用的。一大波基礎硬體廠商和初創企業之所以能風起雲湧(截至2018年至少有45家),正是因為硬體解決方案的技術壁壘極容易被攻破。而谷歌和亞馬遜在AI和機器學習領域的演算法和軟體技術,其優勢可能會很快超越硬體創新所帶來的提升。
在這樣的高壓環境下,facebook過度押注於產業生態的故事,而忽略了商業化本身的嚴峻現實,資本市場恐怕會率先“用腳投票”,談及幫助開發者或許還為時尚早。
但無論如此,積極轉型也預示著新的變化的開始。至於這場“硬體開源”的升級版絕地求生,到底是恢弘故事的開頭,還是狗尾續貂的序章,時間終會證明一切。
更多精彩內容,關注鈦媒體微訊號(ID:taimeiti),或者下載鈦媒體App