今年最後一場!英偉達在GTC China大會上揭露最新合作生態發展
一如 NVIDIA 從 2017 年之後持續彈奏的主旋律,這場在蘇州舉辦的 GTC 大會也是以“ I Am AI” 開場,NVIDIA CEO 黃仁勳也出席了 NVIDIA 今年最後一場的 GTC 大會,一如過往,被 NVIDIA 粉絲暱稱為 “黃教主”的黃仁勳,絲毫看不出受到近來 NVIDIA 財報不佳、股價連續重挫的影響,照樣神采奕奕的在今年 GTC 大會上以昂揚的聲調語氣賣力傳教。
NVIDIA 最近股價的跌法,和 2 年前從 70 美元附近起漲之後的漲法一樣,都讓許多人來不及反應,當初是漲得讓人措手不及,而這次,則是跌的讓人進退不得。 2018 年的高點 292 美元,到經過幾天重挫之後終於略見止穩的 20 日收盤價149.8美元,NVIDIA 股價接近腰斬的走勢,有人認為是有部份原因來自於整體美國科技股大跌的拖累,但不可否認的是,站上 AI 產業浪頭最高點的 NVIDIA,是過去 2 年全球AI熱潮中最大的獲益者之一,不論從股價漲幅、或是獲利增長,甚至是黃仁勳在整個產業的地位來看,都是如此。
NVIDIA 近來的處境,固然有其他因素的影響,但不可否認,在 AI 領域,NVIDIA 仍有非常高的不可取代性。許多人或許會認為,這場在蘇州金雞湖畔的 GTC 大會沒有新產品的亮點,但根據 DT 君的觀察,包括 HGX-2 在中國的落地,就有百度、騰訊、浪潮、聯想等大廠的加入,又或者是剛釋出的 NGC 容器(Container),更可看到阿里雲、聯想、浪潮、華為以及曙光的身影,以此來看,NVIDIA 的近來或許確實略見憔悴,但既有的根基不失,NVIDIA 的實力仍是其他後進架構業者短期內難以撼動的。
根據 DT 君觀察預測未來幾季的產業市場變化,NVIDIA 的冬天可能還會持續一段時間,也許幾季、也許一年,但不論如何,在今年最後一場的 GTC 大會上,宣佈與多家中國大廠持續在新專案上的持續深度合作,能與中國大廠客戶一起抱團過冬,或許是 NVIDIA 在這場 GTC 大會上最值得被注意的的關鍵亮點。
對 NVIDIA 而言,雖然主要新產品還是會在 GTC 大會上揭露,但隨著 GTC 舉辦的次數增加,由於不可能每一次大會的舉辦都剛好會有配合新產品釋出,因此 GTC 已經從過去的新品發表定位,轉而成為生態佈局的宣示大會,而這次在蘇州舉辦的 GTC 大會上,也同樣不見新產品的曝光。

圖 | 黃仁勳(來源:DT君)
然而,NVIDIA 執行長黃仁勳在這場大會上也不改其一貫本色,除了展示其遊戲效能優勢以外,在專業計算領域則是強調合作廠商的生態布建,強調其 GPU 不僅效能具優勢,也同時是最廣泛,也最好用的 AI 加速裝置。

圖|通過機器學習,圖靈架構可以提供更好的遊戲畫質表現(來源:DT君)

圖|光線追蹤技術仍是 NVIDIA 獨享,效果也相當優秀,只是應用支援還有待成熟(來源:DT君)
除了一開始由網易的逆水寒遊戲和實時繪圖 demo 展示其光線追蹤效果作為開場,這場大會上,主軸還是圍繞在計算能力方面。

圖|NVIDIA 以各種形式突破摩爾定律限制,讓 GPU 成為未來計算核心(來源:DT君)

圖|GPU 已經是全球 Top 500 超算榜單上的常勝軍,不僅是絕對效能指標,在能耗表現上也是名列前茅(來源:DT君)

圖|AI 是未來包含超級計算機以及超大規模伺服器計算叢集的未來趨勢(來源:DT君)
HGX-2以其效能優勢獲得中國伺服器廠商青睞
首先,在今年稍早釋出的 HGX-2,號稱是規模最大的單一 GPU 計算架構,搭載 16 塊 Tesla V100,以及 512GB 記憶體,可為企業提供能強大的運算能力,該公司表示,將其用於 ResNet-50 訓練基準測試上,每秒能訓練 15 萬 5 千張圖片,其算力相當於一臺擁有 300 顆 CPU 的伺服器。

圖 | 前些時候發表的 AI 計算方案已經獲得大規模採用
另外,HGX-2 亦提供多重精度(Multi-precision)計算,能為其客戶帶來更廣泛的應用彈性與應用場景,比如說在科學計算和模擬這類要求高資料計算精準度的應用上,HGX-2 能提供雙精度與單精度浮點數運算,另外,也可以使用半精度浮點數或是 Int8 來做人工智慧模型的訓練以及推測計算。
相較起新興的 AI 計算方案,多半集中在推理或者是低精度的機器學習能力上,並以最寬鬆的標準來定義其包含 TOPS 或 TFLOPS 等算力指標,NVIDIA 為了要和客戶達成更緊密的合作,還是選擇比較不誇大的效能指標定義。雖然乍看之下 NVIDIA 可能在算力指標落後於其他 AI 後起之秀,但就實際應用上仍能佔有優勢。

圖|中國一線雲端計算與伺服器供應商都已經加入 HGX-2 的生產與使用行列(來源:DT君)
而在本次 GTC 上的重磅訊息之一,就是 HGX-2 在中國的落地,其客戶包括了百度、騰訊、浪潮、聯想等。而值得注意的是,積極發展自有云計算硬體的曙光和華為也是 NVIDIA 此波宣佈的客戶之一,可見其強大的軟體與硬體互相搭配的生態實力仍非不具備成熟生態的後進架構所能相提並論。

圖|主要雲端計算服務商都採用了 NVIDIA 的新架構,匯入的速度比以往快了許多(來源:DT君)

圖|T4 在小布局上可達到標準 GPU 計算效能,且功耗更低,目前已經被作為百度雲主要的推理計算核心(來源:DT君)
通過NGC容器大幅加速機器學習落地
而另外一個重點在於甫於上週於 SC18 發表的新版 NGC 容器,也成功開拓主要雲端計算中國客戶。NGC 容器登入服務現在已經可提供 41 項用於深度學習、HPC 和 HPC 視覺化的框架和應用程式(去年為 18 個)。而近期增加的內容包括 CHROMA、Matlab、MILC、ParaView、RAPIDS 及 VMD。
在 GTC China 大會中,黃仁勳展示通過 NGC 容器的支援的效果,可為研究人員提供一個快速開發的平臺,提供快速構建、訓練及開發深度學習專案所需的效能和靈活性。NGC 容器登入服務最早便推出五個支援多節點部署的容器,讓這件事變得簡單,使得在多個節點(各節點又有著多個 GPU)上執行大量計算工具,是一件極為輕鬆的事。而在最新的更新版中,可在 Singularity 容器裡使用 NGC 容器,更有助於客戶簡化部署工作。Singularity 是一種超級計算機設施廣泛採用的容器技術。

圖|NVIDIA 的開源機器學習加速庫以及是許多雲服務廠商的框架(來源:DT君)
過去阿里雲服務已經是 NGC 容器的愛用者,而亞馬遜網路服務 EC2,谷歌雲平臺,微軟 Azure,甲骨文雲基礎設施基本上也都支援了 NGC 容器,而 NVIDIA 在蘇州 GTC 上釋出的最新 NGC 容器 Ready 計劃合作伙伴,包括了聯想、浪潮、華為以及曙光,通過這個技術,採用來自這些廠商的伺服器,可大幅縮短部署 GPU 加速應用的時間,並強化最終應用效能表現。

圖|黃仁勳再次強調 RAPIDS 對於加速機器學習的幫助(來源:DT君)
RAPIDS結合龐大開源GPU資料,幫助全球主要雲服務廠商快速部署基於GPU的AI算力
而在上個月,NVIDIA 在北京所釋出的 RAPIDS 開源 GPU 資料加速平臺也獲得重要客戶的採用,包括華大基因用以進行癌症治療的研究,而中國移動則是利用該加速平臺來進行網路優化工作,至於平安科技則是使用該技術來發展大型疫情監控與預測平臺,都是用來解決與我們最切身相關的問題。
RAPIDS 的概念是,典型的大資料分析流程大致分為資料準備、資料合併、資料降維三個步驟,很多資料特徵需要靠行業或專業領域的專家去理解,並事先把它們提取出來。因此在 Machine Learning 中需要訓練過程,這是一個不斷的迴圈過程,在不斷優化、不斷調整引數的過程中,提高訓練過程的精度,從而得到更準確的預測結果。

圖|RAPIDS的成功案例(來源:DT君)
為了達成這樣的大資料分析流程,就必須整合多種開源工具的力量,從不同型別的資料下手,最終形成更具效率的機器學習與訓練過程。
RAPIDS 構建於 Apache Arrow、pandas 和 scikit-learn 等流行的開源專案之上,讓 GPU 可以在最流行的 Python 資料科學工具鏈帶來提速效果。而為了將更多的機器學習庫和功能引入 RAPIDS,NVIDIA 也廣泛地與開源生態系統貢獻者展開合作,其中包括 Anaconda、BlazingDB、Databricks、Quansight、scikit-learn、Ursa Labs 負責人兼 Apache Arrow 締造者 Wes McKinney 以及迅速增長的 Python 資料科學庫 pandas 等。
強調軟體與生態,本次GTC重點在於GPU的技術落地優勢,而非空談雲端
NVIDIA 通過本身計算架構的改進,開發工具的完備,並結合主流開源工具,儘量讓更多的應用情境可以用最快的速度套用在 GPU 加速設計中,這種投資沒有捷徑,而一旦完成,就可大幅確保其在計算領域中的優勢可繼續維持,而不用懼怕被後來者迎頭趕上。
通過這場在蘇州舉辦的 GTC China 大會,NVIDIA 似乎也是在向中國的許多 AI 架構發展廠商傳達 1 個資訊,那就是 NVIDIA 並不是只在硬體架構上耍把戲的廠商,要做好 AI 計算、雲端計算,沒有軟體、周邊配合,就只能註定在狹窄的應用場景中求生,那麼,就算設計出來的硬體架構如何高強,最終也將如無米可炊的巧婦。
而值得注意的是,根據 NVIDIA 透露出的最新資訊,全球範圍已經有超過百萬開發者註冊 NVIDIA 的開發社群,同時 NVIDIA 也在全球高等學府提供多種基於 GPU 計算的課程教育,從根基打起,並擴及產業。
另外,NVIDIA 的 GPU 產品也是目前除了 CPU 以外最普及的計算架構之一,目前稍微高階一點的電腦裡面可能都會有 GPU 存在,但一般人要拿到寒武紀的計算卡來作個人開發用途是幾乎不可能的事情,而這點也決定了 GPU 在計算產業的影響力。這也是 NVIDIA 之所以堅持 GPU 之所以為 GPU,而不願意打造如常見後進 AI 計算晶片那種純粹化的計算架構的最大理由。