邊緣計算晶片格局分析 | 半導體行業觀察
來源:本文由 微信公眾號 半導體行業觀察(ID:icbank)李飛 原創,謝謝。
近日,華為和位元大陸紛紛釋出了針對邊緣計算的新晶片產品。華為的Ascend系列採用達芬奇架構,其中Ascend 310功耗8W算力8TOPS正是針對邊緣計算市場。而之後位元大陸釋出的BM1682和BM1880也是針對邊緣計算市場,其中BM1682功耗30W算力3TFlops針對邊緣伺服器市場,而BM1880功耗3W整數算力2TOPS則是針對邊緣終端市場。人工智慧結合邊緣計算已經成為最熱門的市場之一,我們今天就來分析並展望這個市場。


邊緣計算新興市場
人工智慧晶片市場第一個得到關注的是雲端伺服器市場,Nvidia的GPU以其強勁的算力掌握了大部分市場。隨著人工智慧的鋪開,邊緣計算(edge computing)的概念也得到了越來越多的認可。邊緣計算相對於雲端計算有幾點優勢,首先是延遲較小,在雲端和終端通常有幾十毫秒到幾百毫秒不等的網路延遲,對於工業應用等對延遲有高要求的應用來說雲端部署人工智慧無法滿足其對於延遲的需求;其次是資料隱私,有些應用不希望把資料傳輸到雲端,一方面擔心雲端資料被雲運營商看到,另一方面擔心資料傳輸過程中被黑客劫持;最後是可靠性,如果把人工智慧部署在雲端那麼一旦網路斷了在終端的人工智慧程式就無法工作了,這對於要求高可靠性的應用來說難以滿足要求,但是如果把人工智慧部署在邊緣就沒有這個問題。
邊緣人工智慧計算中其實還包含了多個層次,一種是終端裝置(如手機)上的人工智慧計算,這樣的規劃把人工智慧計算直接放到終端裝置上,可以實現最低的延遲。然而,由於終端裝置的電池容量有限或者對於散熱容忍度較低,因此在終端裝置上做人工智慧計算對於AI晶片的能效比提出了極高的要求,同時這樣也並非唯一的邊緣計算形態。
除了終端裝置上的直接做計算之外,還可以把終端的資料放到離終端比較近的本地伺服器去計算。例如,對於工業應用這樣的對於穩定性和延遲有要求但是又可以做叢集化計算的應用,除了把計算直接放到終端裝置之外另一種方法就是就近設立邊緣伺服器讓計算放到邊緣伺服器上去做然後快速返回給終端裝置。邊緣伺服器對於晶片功耗的要求相比在終端裝置上直接計算就會寬鬆許多,因此非常適合於這種可以叢集化計算的應用。
邊緣計算的兩種市場目前都已經在起飛。而相關AI晶片也得到了許多關注。標誌性事件是華為的兩次晶片釋出會。去年秋天釋出的麒麟970晶片附帶NPU,可以說是人工智慧部署在手機的一次重要嘗試。今年秋天又釋出了Ascend系列晶片,其中Ascend 310晶片也是針對邊緣伺服器市場並且華為已經開發了基於Ascend 310的邊緣計算伺服器準備部署在自動駕駛領域。因此我們可以預計在未來無論是相關應用還是相關晶片都將有更多公司大手筆投入,從而推動AI進一步發展。
邊緣伺服器的晶片形態與競爭格局
邊緣伺服器的市場現在來看將是人工智慧最早落地的應用 之一(甚至比手機裡的人工智慧還要早且成熟),因為目前中國的智慧攝像頭產品已經在安防、人臉識別等領域真正落地,而邊緣伺服器是很適合智慧攝像頭的產品形態,一方面在不少此類應用中對於可靠性有很強的需求,因此部署在邊緣端的人工智慧更適合;另一方面智慧攝像頭的計算可以叢集化操作,因此一個邊緣伺服器處理多路智慧攝像頭的形式是非常經濟的方式。除了智慧攝像頭之外,無人駕駛也是邊緣伺服器的一個例子,因為在無人車裡面需要做感測器融合做大量計算,相當於在無人車上部署了一個邊緣伺服器。
邊緣伺服器市場通常對於通用性有一定需求,因此比較合適的方案是處理器加上通用型深度學習加速晶片,而深度學習加速晶片最常見的形式是以PCIe加速卡的形式插到主機板上,並與主處理器協同工作。值得注意的是,由於邊緣伺服器對於人工智慧演算法精度有一定要求,因此往往使用的是類似半精度浮點數的運算方式,很多邊緣終端晶片上常見的INT-4甚至INT-2等激進的低精度整數運算由於損失精度過多因此在邊緣伺服器不太適合。
我們認為邊緣伺服器市場尚屬於新興市場,加入戰場的公司並不多,目前僅有Nvidia,華為,位元大陸等, 而且不同的公司可以主打不同的細分市場,因此市場競爭遠未飽和。我們不妨來分析一下Nvidia,華為和位元大陸三家公司的競爭格局。Nvidia的產品是Xavier晶片,峰值算力30TOPS,功耗30W,主要針對的是自動駕駛市場,因此晶片上還集成了雙目視覺、光流等,模組售價2499美元,顯然是針對高階自動駕駛市場,而對於智慧攝像頭等對於部署成本有要求的場合並不合適。
華為的Ascend 310定位中高階,其8W/8TFlops的效能下可覆蓋智慧攝像頭市場,上可進擊自動駕駛市場(華為已經與奧迪合作,釋出了基於Ascend 310晶片的自動駕駛邊緣伺服器MDC600)。而位元大陸則是主打價效比路線,BM1682自帶視訊解碼和後處理操作且集成了CPU,因此客戶需要加速智慧機器視覺相關應用時理論上只需要BM1682即可,無需再去購入額外的CPU,這也降低了成本。

目前在中國市場,最主要的市場還是安防等應用的智慧攝像頭,因此產品定位決定了主要是華為和位元大陸之間的競爭,那麼位元大陸和華為之間的競爭格局會如何呢?我們認為,首先這個市場很大,華為和位元大陸的主打方向也不相同(華為主打效能而位元大陸走價效比路線),因此並不存在勢不兩立的激烈競爭。另一方面,其實華為和位元大陸的共同競爭對手是海康威視這樣的智慧攝像頭系統廠商,一旦海康威視也開始自研晶片且在自己的安全攝像頭系統中以各種方式推廣自研邊緣伺服器,那麼華為和位元大陸的壓力將會很大。不過我們預計到那個時候智慧攝像頭以外的市場也會變得成熟,從而給華為和位元大陸等晶片公司提供新的機會,而不用被迫在智慧攝像頭領域與巨頭系統廠商競爭。
邊緣終端市場的晶片形態與競爭格局
邊緣終端市場是指直接在終端裝置上做計算的AI晶片,對於功耗和能效比有很強的要求。目前來看,邊緣終端市場有兩種形態的晶片產品,一種是針對特定應用的SoC,一種是通用加速器做獨立晶片。SoC面向專用市場,在晶片中深度學習加速計算事實上只是一小部分,而其他大部分芯片面積則交給了主控處理器、視訊解碼等等模組。SoC整合度高,一般的技術路線是用新的SoC代替原有的不支援深度學習加速的SoC做更新換代。
一個典型的例子就是華為麒麟系列SoC加入寒武紀的NPU,就屬於SoC自己的更新換代。專注於AI晶片的廠商進入SoC市場的策略往往是提供IP授權,以發揮自己的強項(如寒武紀給華為提供NPU IP)。對於SoC往往針對的是一個特定市場,因為其中的模組都是針對該應用而設計,如果用在其他應用中則顯得浪費,例如麒麟SoC最適合的場景是手機,其中包含的GPU、ISP、Modem等都是為了手機場景打造,如果是用在工業場景則這些模組都閒置了,因此也就引出了另一個終端通用型深度學習加速器晶片市場。該市場相對於SoC市場來說允許較低的整合度,即可以在主控晶片之外再搭配額外的晶片以支援相應功能。
在終端SoC市場,事實上競爭已經白熱化,華為、高通等公司都紛紛推出專屬的SoC搭載 AI加速模組,而AI加速模組IP的提供商也有ARM,Cadence,CEVA等傳統IP提供商以及寒武紀這樣的初創公司。不少傳統SoC晶片公司都紛紛在自家SoC中加入自研或授權的人工智慧模組。對於人工智慧終端SoC市場,我們的分析是該市場雖然最早得到關注但是很可能近幾年還是被原來的SoC公司佔領市場,因為目前終端人工智慧市場尚未真正落地收穫真金白銀,因此SoC中加入人工智慧還只是錦上添花之舉。
在IP授權方面,Cadence和ARM入局意味著小公司面臨巨大壓力,因為IP市場存在一定的頭部效應,且Cadence和ARM可以通過與其他的優勢IP做捆綁銷售來推銷其人工智慧IP,在人工智慧並非最關鍵SoC模組的市場現狀下,小公司想要與Cadence和ARM等巨頭競爭只能走差異化,例如超低功耗或模擬計算等路線。
終端通用深度學習加速器晶片市場的應用則剛起步,之前Movidius推出的神經計算加速棒並未引起巨大反響。但是這並不代表這個市場不存在,而是還處於幼年期,需要培養,因此許多公司在這個市場佈局主要一是培養開發者生態,另一方面也探索研究哪個市場最有潛力,預計在市場成熟之後再收縮戰線,針對幾個重要的應用推出相應的優化晶片,從而佔領最合適的市場。因此,目前對於這個市場最合適的策略是推出開發板和外掛式加速硬體(如USB加速棒)這樣簡單易用的產品,這樣廠商和客戶可以一起探索市場需求,決定最佳產品形態。 我們看到位元大陸就是在這個市場跟隨Movidius推出了BM1880晶片,並配套推出了開發板、晶片模組以及USB加速棒等多種硬體形態供客戶挑選,我們相信在近期將會看到通用型終端人工智慧加速器的更多應用。
未來發展預期
如之前的分析,我們預計在人工智慧邊緣計算會成為未來最重要的人工智慧硬體市場之一。在邊緣計算領域,邊緣伺服器晶片市場非常重要但是目前廠商不多,我們預期會有不少公司入局,包括從晶片領域提出超高效能的初創公司,以及海康威視這樣的系統廠商開始自研晶片,而如華為、位元大陸等已經提前入場的公司也會繼續加大投入。
在終端邊緣計算市場,SoC晶片(AI加速器IP)領域競爭已經非常激烈,未來恐怕會有一波洗牌的過程,最後只會剩下幾家能在不同細分市場牢牢把握住客戶的公司。在通用終端加速器晶片領域我們則可望看到更多應用出現,在未來幾年內我們能看到的邊緣終端加速器應用實際上將會很大程度上決定這個市場的具體規模。
最後,我們必須看到邊緣計算等人工智慧晶片應用目前最大的市場其實在中國。這是因為中國的人工智慧落地情況遠好於美國。在政府的支援下,曠視、商湯、依圖等初創企業紛紛推出優秀的產品並在市場上站住了腳跟,這一方面加速了基於人工智慧的應用成熟,另一方面也給人工智慧晶片帶來了市場,從而為人工智慧的完整產業鏈的成熟帶來了機會。我們可以肯定地說,人工智慧晶片的未來還得要看中國!