優化晶片架構+5G“雙拳出擊”,深度解析高通手機晶片戰略
在2014年的時候,手機晶片市場往往會強調功能整合化、效能電腦化、通訊多模化、平臺一致化等特點,這是由於當時手機晶片都要滿足一定的標準,即面向第四代移動通訊技術標準(4G)LTE的整合通訊基帶處理功能以及移動計算處理能力一體化標準。
在隨後的兩三年裡,世界掀起了一股人工智慧的熱浪。各行各業紛紛擁抱了人工智慧,智慧手機作為移動終端的代表行業,自然也入了局。
到了2018年,也就是現如今,人工智慧晶片早已不是什麼新鮮事物,而面對產業即將到來的革命性的轉折點,需要關鍵時刻的定音一錘。
不可否認的是,手機晶片將在其中扮演重要角色,而以目前全球手機晶片領域發展來看,高通的名字肯定是不陌生的,其手機晶片業務分佈全球,中國幾家頂尖的手機OEM大廠,如小米、OPPO、Vivo等,均在其旗艦手機設計方案中採用了高通的晶片。
前瞻:AI發展需邁過能耗一關
高通認為當前的AI發展面臨兩個重要挑戰:1.AI創造的經濟價值和效益必須超過執行服務成本;2. 突破移動環境中的散熱限制。
第一個挑戰很好理解,說白了就是要保證產出高於投入,維持利潤空間。以智慧安防攝像頭為例,要保證其能夠24小時不間斷地工作,同時還要讓監測和識別都要執行深度神經網路以起到人工智慧安防的作用。但是開發深度神經網路需要很大的研發投入,同時維持24小時執行目前需要很高的硬體成本,長時間運作會增加硬體損耗,同時中低端電子元件根本無法支撐24小時連軸轉的業務,因此是硬體成本高。若想擁有利潤,必須降低這兩者的投入和成本,或者創造更大的商業價值。第二個挑戰則是應對在移動環境中支援AI應用所帶來的負載,包括完成非常密集的計算分析任務、處理複雜的併發性任務,以及兼顧實時和始終開啟。AI應用需要大量的計算支援,如果在功耗方面不能很好地優化,那麼手機啟用AI應用就可能因為功耗過大而導致發熱。
高通技術副總裁韋靈思對此的觀點是,未來AI演算法需要更注重於能耗,即每瓦時電力能提供的智慧。其實高通早在十幾年前就對脈衝神經網路展開了研究工作,這是一種源於人腦的低功耗計算方法。而到了今天,高通同樣也在利用類似於大腦運作的型態來進行深度學習方面的設計。

(來源:麻省理工科技評論)
人腦其實是一個充滿噪聲的系統,它知道如何處理噪音。由此得到啟發,高通正研究如何利用噪音來降低神經網路計算的功耗,這種方法也被稱為貝葉斯深度學習。對於高通來說,這是他們進一步發展AI和神經網路技術的重要基礎性框架。通過貝葉斯深度學習,神經網路可以壓縮得更小,使其可以更高效地執行在驍龍平臺上。高通還通過使用這一框架,量化需要進行的計算處理的位元位。
而利用貝葉斯框架進行的壓縮與量化,也可以用來解決其他的問題。如果神經網路只進行過面向某一場景的訓練,但是將其放入新的,並且與其之前訓練場景相似的地方時,其依然能工作。例如一臺自動駕駛汽車只接受過某一城市的相關訓練,現在這臺汽車來到另一個新的城市,就能用貝葉斯深度學習進行泛化,從而降低深度學習的功耗。韋靈思說:“高通的思路是,能夠對資料做出解釋的最小、最簡單的模型即為最適合的模型,這就是奧卡姆剃刀。”
在現階段,通道裁剪和SVD也是較為流行的壓縮手段。在壓縮比較小時,這兩種壓縮手段和貝葉斯剪裁併沒有太大區別。但是隨著壓縮比越來越大,貝葉斯深度學習相比於其他方法的效能優勢就越明顯,其在移動平臺上的執行也更為高效,這正是高通選擇它的原因。

(來源:麻省理工科技評論)
除了演算法的改進,高通也在提升AI硬體的設計。在高通的異構計算系統中包括了三個元件,分別是CPU、GPU和DSP。十餘年來,高通持續從多個維度上優化這三個元件的設計,其中在快取結構(caching structure)上不斷優化記憶體工作方式以及低功耗的精確度是最具代表性的。在三個元件的計算管理上,高通也進行了優化,比如在面對一個計算任務時,可以選擇讓GPU、CPU或是DSP單獨完成,也能讓所有元件共同完成。展望未來,隨著技術的發展,尤其是5G和萬物互聯技術的到來,高通會把計算放在由終端及雲端組成的整個網路中執行,進一步提升位於網路邊緣的AI系統,網路邊緣就是指非雲伺服器和終端的系統,比如NPU。
從更具體的方向上,高通當前把AI研究的重點放到了三個方面:優化計算架構、記憶體層級及使用層面。在計算架構方面,高通專注於優化指令型別和並行性,以及優化執行計算所需的精確度,利用貝葉斯深度學習的研究成果,能夠實現更好的執行精確度。在記憶體層級,高通需要優化記憶體層級以降低資料移動的功耗。這是因為從DRAM遷移資料或將資料遷移至DRAM的功耗,是ALU運算(ALU Operation)功耗的200倍。在使用層面,高通會優化硬體、軟體和編譯器,從而減少計算的冗餘並最大化計算吞吐量和記憶體頻寬。“比如說,我們可以減少運算物件(operand)的尺寸和數量,同時利用計算稀疏性以確保將資源應用到必要的計算上。” 韋靈思說到。
用異構計算優化解題思路
光說不練假把式,高通於2017年年底釋出了第三代AI移動平臺驍龍845。這款處理器支援Qualcomm人工智慧引擎AI Engine(AIE),並採用了全新的Qualcomm Hexagon 685 Vector DSP架構,再加上其對GPU以及CPU的優化,終端側神經網路執行速度比前代提高了三倍。
在本產品上,高通強調了人工智慧從雲端到終端的遷移,使得一些本應該執行在雲端的計算任務跑到了終端上,由此提高了執行速度、連線能力和安全性。

(來源:高通官網)
所謂AIE,簡單點說就是能夠實現雲端之外的機器學習任務。大多數移動機器學習任務(如影象或語音識別)目前都需要使用者把資料從客戶端傳送到伺服器端,然後再將計算結果返回到手機,AIE相當於允許手機直接執行任務,減輕了從傳輸到後端運算之間的資源消耗量。因此,客戶端響應速度更快、隱私保護增強、可靠性提升。
通常,開發者會以32位浮點數(高精度)在雲端訓練神經網路模型。雖然也可以在裝置的CPU或GPU上執行類似訓練,但是成本相對高昂,也要求高效能的裝置。驍龍845的GPU對16位浮點數精度運算進行了優化,CPU也對8位定點數精度進行了優化。此外,作為DSP子系統中的向量加速引擎,HVX(HVX 向量擴充套件)可以用8位向量計算來加速神經網路的執行。對於開發者而言,這種優化能夠讓開發者提供更靈活的設計思路,將AI的計算負載根據實際情況分配到CPU、GPU和向量處理器上。
在神經網路框架方面,驍龍845進一步擴充套件支援更多框架,例如Google的TensorFlow、TensorFlow Lite和Facebook的Caffe2。同時高通在驍龍神經處理引擎(SNPE)SDK中添加了對ONNX(開放式神經網路交換)交換格式的支援,這樣一來,開發者就能在他們的框架中開發神經網路,而無需擔心底層硬體支援哪種網路的問題。
當然,手機晶片的設計思路也要符合手機OEM廠商。驍龍845支援OPPO和Vivo等公司的人臉檢測、背景虛化和地標檢測等諸多人工智慧應用。一些傳統的攝像頭元件可用基於視覺的神經網路來代替。比如,通常使用固定的CV演算法和兩個攝像頭來實現背景虛化。驍龍845還可以利用與攝像頭配對的神經網路,降低拍照延遲並提升成像精確度。

(來源:麻省理工科技評論)
除了手機OEM廠商,高通還跟不少AI軟體開發商和雲服務商合作,進一步提升手機上的AI使用體驗。其合作伙伴除了商湯科技和曠視(Face++)這兩家AI獨角獸外,還有大家熟悉的騰訊QQ、網易有道、百度等。手機有望成為未來最廣泛的人工智慧平臺,各大企業自然伸出橄欖枝,攜手搶佔AI先機。
除了驍龍845,高通還有多款中高階驍龍平臺同樣支援人工智慧引擎AIE,包括800系列的前兩代旗艦驍龍835和驍龍820/821,全新700系列的驍龍710,以及屬於600系列的驍龍660和670。其中,作為驍龍700系列的首款產品,驍龍710的推出尤其引人注意。基於10納米制程工藝,驍龍710將頂級的AI效能下放到更多智慧手機之中。與驍龍660相比,驍龍710在AI相關應用方面的效能提高了兩倍。

(來源:高通官網)
驍龍845以及驍龍710可以說是上一個段落的具象化產品,不過這並不是高通在人工智慧手機晶片上的最終答卷。對於任何領域的巨頭來說,只要這家企業想要引領某一行業的革命,他們僅有在一種可能性才會停止腳步,那就是下一次行業革命。
比起眼睛,人們更喜歡用頭腦觀測未來
事實上高通在強調人工智慧所構建的社會,不僅僅是手機晶片,這也是為什麼高通將驍龍系列產品定位為“移動平臺”。2021年時,人工智慧衍生的商業價值將達3.3萬億美元,這距離今天只有幾年的光陰。
然而整個社會要想實現巨大的人工智慧理想,就必須要依靠牢固的基礎設施,也就是這些比指甲蓋還小的晶片。根據統計,在之後的四年裡智慧手機累計出貨量將超過86億部,意味著移動終端將是構建人工智慧平臺的重要組成部分。
基於這些,高通在從事人工智慧方面研究的同時,也在推進5G的發展。超高速、低時延的5G連線除了可以接入網際網路外,還可以與額外的處理器進行連線。當終端進行無線邊緣構建計算能力時,移動終端上的邊緣網路處理能力與5G之間的結合,將為終端帶來巨大的計算力。

(來源:麻省理工科技評論)
高通總裁阿蒙強調:“過去,訓練、執行和推理都是在雲端處理的。5G時代,訓練、執行和推理將也可以在終端側實現,所有的邊緣終端都將具備機器學習能力。這意味著,資料處理將在最靠近資料來源的位置處理,對雲端計算能力進行補充。這保證了使用者的隱私,因為在終端裡便可以支援實時的機器學習處理。同時因為在最靠近資料來源的位置完成處理,它還將帶來可靠性和低時延。終端側處理還將帶來高效性,因為它始終面向移動環境對於外形尺寸、能效、效能等方面的挑戰。此外,它也將有助於支援個性化。”
對於人工智慧來說,5G是與之相輔相成的事情。這兩者的關係就像是球員與教練,在世界盃上,法國隊年輕小將們捧起獎盃的一剎那,少不了主教練Didier Deschamps告誡他們的紀律與耐心。
不過這仍然不是人工智慧的最終樣式,也不是5G的。在更遙遠的未來,人工智慧還會有更高階的形態,通訊技術在5G之後仍將持續會持續演變進化。值得注意的是,就如同過去從2G、3G、4G的世代技術演進所帶動的產業競爭消長一樣,其中的關鍵所在,就在於如何真正理解新一代通訊技術將如何改變世界的意義,應用場景才是根本所在,而在5G時代,人工智慧就將在其中扮演啟用應用場景與生態發展的重要角色。因此,可以看到包括高通等廠商,其在人工智慧領域的佈局不但積極,而且更加深化,而其所長期累積的深厚通訊核心技術實力更將成為加速前進的動能。事實上,當發展歷史超過60年人工智慧遇上即將爆發第5代移動通訊技術5G,這將會是IT (Information Technology)與CT (Communication Technology)的融合變革,也是一次產業全新變革的啟動,而這一次,更將是一次改變遊戲規則的機會所在。