不止AI,華為曝光全球首顆7奈米Arm伺服器晶片 | 半導體行業觀察
來源:內容由 微信公眾號 半導體行業觀察 (ID:icbank) 李壽鵬 原創,謝謝。
在昨日舉行的華為全連線大會上,華為終於揭開了其自研AI晶片的神祕面紗。
據華為輪值總裁徐直軍介紹,華為這次推出的兩款晶片分別是昇騰910和昇騰310,這都是華為基於其自研的達芬奇架構打造的兩款新品。其中昇騰910是當前單晶片計算密度最大的AI晶片。該產品採用7nm工藝打造,最大功耗做到350w,其他引數也是表現優越:在半精度 (FP16)下,可以做到256 TeraFLOPS,在整數精度 (INT8)下,更是做到了512 TeraOPS,另外,該款晶片還支援128 通道的全高清視訊解碼器(H.264/265)。

徐直軍表示,華為昇騰910在與英偉達和谷歌的晶片對比時,也擁有強大的領先優勢。晶片將在20 19年Q2到來,這會在雲端給華為帶來訓練和邏輯服務系列的強大支援,衝破現在市場被TPU和英偉達壟斷的局面。

另外,華為還發布了昇騰310,按照徐直軍的說法,華為這款極致高效計算低功耗的AI SoC是針對邊緣AI而推出的產品。作為一款同樣採用達芬奇架構的晶片,華為昇騰310採用了12nm FFC工藝製造,在半精度 (FP16)情況下,可以做到8 TeraFLOPS,在整數精度 (INT8) 下,則能做到16 TeraOPS,還能支援16 通道全高清視訊解碼器 - H.264/265,而其最大功耗只有8W,這款晶片現在就已經能夠給客戶提供全方位的支援。

華為方面表示,他們基於統一、可擴充套件架構的系列化 AI IP和晶片昇騰擁有nano、tiny、mini、lite和max五個系列,能提供橫跨全場景的最優TOPS/W支援。
徐直軍在接受採訪的時候向記者強調,華為的昇騰晶片將不會對外單獨銷售,而是以AI加速卡、加速模組、伺服器和一體機等模式對外銷售。華為的全棧AI戰略也在昇騰面世之後,得到了全方位補全。

在面向未來的AI機會,華為將會聚焦在投資基礎研究、打造全棧方案、投資開放生態和人才培養、解決方案增強和內部效率提升這五個方面。具體而言就是:
- 在計算視覺、 自然語言處理、 決策推理等領域構築資料高效(更少的資料需求)、 能耗高效(更低的算力和能耗),安全可信、自動自治的機器學習基礎能力;
- 打造面向雲、 邊緣和端等全場景的、 獨立的以及協同的、 全棧解決方案, 提供充裕的、 經濟的算力資源, 簡單易用、 高效率、 全流程的AI平臺;
- 面向全球, 持續與學術界、產業界和行業夥伴廣泛合作;
- 把AI思維和技術引入現有產品和服務, 實現更大價值、更強競爭力;
- 應用AI優化內部管理, 對準海量作業場景, 大幅度提升內部運營效率和質量;
華為這些新產品的推出,在業界引起了廣泛討論。無獨有偶,筆者也從知情人士處看到了華為的Arm伺服器晶片的相關產品曝光。
華為7奈米
Arm伺服器晶片曝光
日前,華為正式對外披露了其新一代的Arm伺服器晶片Hi 1620。
據知情人士告訴半導體行業觀察記者,華為這顆Arm伺服器晶片是基於Arm V8 架構自主設計的,使用當前業界最先進的7nm工藝打造。據瞭解,華為在此晶片上提供32、48和64核的版本,最高支援2.6/3.0Ghz的主頻,能夠支援PCIE 4.0&CCIX。
華為方面表示,這是業界第一顆支援PCIE4.0的7奈米Arm伺服器晶片。從華為的PPT中我們可以看到,Hi 1620的48核版本的CPU和英特爾Skylake 8180 的SPECint 效能相當,但在功耗方面會比後者低20%。

作為一個涉足廣泛的企業,華為的Arm伺服器晶片已經有了多代的發展。
從wikichip可以看到,2015年,華為推出了其第一代Arm伺服器晶片Hi 1610,這個採用Arm Cortex-A57設計的16核晶片主頻最高只能做到2.1Ghz。
在2016年,中國十二五科技創新成就展上,華為展出了其第一臺ARM平臺伺服器“泰山”(Taishan),配備自主研發ARM架構64位處理器“Hi1612”,採用臺積電16nm工藝打造,相容ARMv8-A指令集。華為方面表示,除了儲存單元外,該處理器具有完整的自主智慧財產權,可應用於大資料分析、共有云、資訊搜尋等領域,並已在阿里巴巴試用。
2017年,華為又推出了HI 1616,這個採用Cortex-A72設計的32核晶片最高主頻可以做到3Ghz,再到今年Hi 1620。可以看到,雖然華為並沒有大肆宣傳其Arm伺服器晶片,但是在過去的幾年也都保持每年一款的更新頻率。

考慮到華為本身在手機、雲和儲存等方面的影響力,這個Arm伺服器產品的到來,對於華為本身,是對自身產業鏈的進一步完善。能夠為客戶提供定製化、全方位的可控一條龍服務。
放大到整個中國積體電路產業來說,華為的這個系列產品線或許能在英特爾把持的伺服器晶片市場殺出一條新路。但毫無疑問,這將會面臨來自國內外的多個競爭對手的挑戰。
暗流湧動的
Arm伺服器晶片市場
近年來,隨著Intel伺服器晶片的市場份額的日益攀升,國內自主可控需求的興起,Marvell收購Cavium、華芯通的成立、高通的淡出,Arm伺服器晶片市場一直暗流湧動。雖然開始有些人在退出,但在Arm的推動下,也有新的玩家進入這個市場,華為就是當中一個代表。正如上文所說,從華為的業務上看,Arm伺服器晶片業務對他們來說是一個產業鏈環節的補充。
除了華為之外,國內的飛騰、華芯通,美國的Ampere也都是Arm伺服器市場的重要角色。
首先看一下飛騰方面。
早前,天津飛騰資訊科技有限公司首席科學家竇強在接受半導體行業觀察等媒體採訪的時候提到,飛騰在2017年推出了飛騰FT2000+處理器,這個使用16nm工藝打造的晶片擁有64個核心、主頻可以做到1.8-2.3GHz,以標準spec測試的實測效能和英特爾2013年推出的至強處理器效能相當,飛騰也完成了伺服器儲存、資料庫和中介軟體適配的相關工作。
在竇強看來,飛騰這個處理器效能和英特爾的產品相比還有很大的差距,甚至他們這款產品還是單路設計,不能滿足大規模的設計需求。但是飛騰未來會將其擴充套件兩路,甚至八路,以匹配高階伺服器的處理器需求。
飛騰公司總經理谷虹之前說過,飛騰的CPU雖然是基於ARM技術架構研發,但包括CPU計算模組在內的程式碼部分均為公司歷時多年自主研發完成。這就使得飛騰能夠在這系列產品的自主可控上面,擁有更高的自主權。
來到華芯通,這是由貴州政府和高通共同成立的,專注於Arm伺服器晶片的企業。
據鳳凰科技在今年五月的報道,華芯通自主研發的第一款伺服器晶片——“華芯1號”已經於2017年年底試產流片成功,並將於今年下半年上市商用。而他們研發的第二代產品“華芯3號”目前已經在研製當中。
據報道,這款伺服器晶片只有半張銀行卡大,集成了約10億個電晶體和2800多個管腳,晶片製程為10奈米。通過內建自主安全模組大大提升晶片安全係數,是“華芯1號”的一大亮點,它可以應用在高效能運算機上面,發揮迅速及時處理龐大資料的功能。
至於Ampere,則是由Intel前高管Renee James創立的。在半導體行業觀察之前對James女士發起的專訪中她提到,Ampere的核心團隊大部分來自Intel和AMD這些晶片巨頭,公司的大多數人在伺服器的軟硬體領域擁有非常豐富的經驗,他們對伺服器晶片和軟體的理解相當深入,這就使得他們成為Arm伺服器領域的新興勢力。
在今年九月,Ampere推出了該公司旗下面向資料中心的第一代 64 位 Armv8-A架構的,16nm工藝打造的處理器,這款他們設計的 32 核 Armv8-A 處理器在Turbo 模式下主頻高達 3.3 GHz。處理器已獲得聯想及其他幾家原始設計製造商 (ODM) 的選擇。
按照他們的說法,這款處理器具有優秀的總體擁有成本 (TCO) 價值、強大的計算效能和記憶體容量以及豐富的 I/O,用來處理雲工作負載,包括大資料、Web 層以及記憶體資料庫。
Ampere 還公佈了未來多代產品路線圖,包括下一代 的7nm 產品等。這款產品將提供單插口和多插口選項,並於 2019 年上市,這將用於將來的超大規模雲端計算和邊緣計算。
上述可見,華為在Arm伺服器晶片方面的領先優勢領先於全球的競爭對手。
總結
雖然華為的Arm伺服器晶片迄今為止一枝獨秀,但我們可以看到,英特爾花費數十年打造下的伺服器生態是無法撼動的。但華為依賴於其多年來積累的晶片設計經驗,又在一個領域走在了全球前年。加上華為本身在AI晶片、ISP晶片、手機SoC和其他各種晶片、終端和應用上的積累,華為未來在Arm伺服器市場必將扮演一個重要角色。
至於未來,就看Arm如何聯合各大晶片供應商、軟體廠商在這個領域的生態上共同發力了。