再次打敗安卓 蘋果A12為何是迄今最強手機晶片?
上個月,蘋果正式推出新一代 iPhone,包括 iPhone XS、iPhone XS Max 及 iPhone XR。按照蘋果的宣傳,iPhone XS 系列是自家迄今為止最先進的新一代 iPhone,實現了智慧手機面向未來的一次巨大跨越。 不過,三款新品都搭載了強大的 A12 仿生晶片。對於這枚晶片蘋果聲稱,A12 仿生是 iPhone 迄今最智慧、最強大的晶片,採用開創性的 7 奈米晶片,具有更節能的設計,提供出眾的效能表現。
具體到 A12 仿生晶片內部和效能,蘋果沒有非常詳細的講解,只是簡單的表示 A12 仿生採用六核心融合架構,與 A11 仿生相比,兩個效能核心的速度提升最高可達 15%,四個能效核心的節能最高可達 50%,同時蘋果自主設計的新四核心圖形 Win10G_na" target="_blank" rel="nofollow,noindex">處理器 ,其圖形效能提升最高可達 50%。
那麼,究竟蘋果口中所說的 A12 仿生晶片與上一代相比達到宣傳的效能提升嗎?CPU 和 GPU 實際效能如何呢?只是 iPhone 迄今為止最強大而已嗎?與安卓陣營的 SoC 晶片相比又如何呢?近日,權威評測站 AnandTech 對 A12 進行了相當詳細的評測,並認為 A12 是當前移動領域最強的晶片,我們來看看這份評測報告中講述了些什麼。
第一枚 商用 的 7 奈米晶片結構分析
AnandTech 表示,在過去的幾年裡,蘋果的晶片設計團隊始終引領行業架構設計和製造工藝。Apple A12 是蘋果又一次飛躍,因為它是全球第一枚商用的 7nm 晶片。
當談及工藝製程,一般來說,數字越小,電晶體就越小。儘管近些年更先進的工藝節點已不等於實際更小的物理尺寸,或者說兩者無必要關聯的意義,但依然可以代表密度的提升。因此,在更先進工藝的晶片內,總是能裝入更多的電晶體。
此前,另一專注晶片結構解析的 網站 TechInsights 公佈了關於蘋果 A12 的內部圖片,因此 AnandTech 據此釋出了一篇簡要分析。
AnandTech 稱,12 仍遵循此前蘋果 SoC 晶片的佈局結構,在右邊可以看到 GPU 叢集,內有四個 GPU 核心和共享邏輯。而在下邊則是 CPU 的複雜結構,2 個大 CPU 核心靠中間偏左,在其靠右一旁是更大的 L2 快取,然後緊挨著 4 個小 CPU 核心以及為其配置的 L2 快取。
晶片中間是 4 大塊 SRAM,作為系統快取的一部分,位於記憶體控制器及內部系統互連和塊儲存器子系統之間,主要當做 SoC 範圍快取層的作用。蘋果利用這塊充分實現節能功能,因為 DRAM 記憶體交換在能耗使用方面一點不小,直接在晶片內快取內容可以減少大量的能耗,還能增強效能。
蘋果 A12 晶片的系統快取發生了自 A7 推出以來最大的變化,佈局上的巨大變化也相當於這塊功能上的巨大變化,現在可以清楚地看到這一部被分離成明顯的四塊。在之前蘋果的 SoC 晶片如 A11 或 A10 上,系統快取看起來更像一個邏輯塊,似乎是兩塊,如今塊數增加可能意味著這部分的效能發生了非常大的變化。
最後,A12 晶片最重要的變化之一是 NPU 神經網路引擎的一次重大改造。針對這部分,蘋果官方聲稱已經從 A11 的雙核設計轉變為全新的八核設計。去年據一些傳聞了解,蘋果的 NPU 設計似乎來自 CEVA IP,不過這點從未得到完全的確認,因為蘋果也不希望這其中的細節被人所知,而且官方的營銷材料多次提到“Apple-designed”,強調這是蘋果內部自主 IP。
A12 採用了 8 核設計,其實際的理論效能提升接近 8 倍,從 A11 的 600GigaOPs 增加到 A12 的 5TeraOPs。通過對比 A11 到 A12 大小的變化,可看到臺積電新 7nm 製程節點帶來的好處。需要注意的是,晶片內幾乎所有的 IP 塊都發生了變化,所以用很難做有效的對比,尤其是確定新支撐對密度提高是多少。
儘管如此,如果將單個 GPU 核心作為對比的參考,不難發現,A12 與 A11 相比,其尺寸減少了 37%。很明顯,新的工藝製程的確幫助蘋果在 A12 內塞進了更多的 GPU 核心,而且 GPU 核心在 A12 中真的非常小。
CPU 部分更大了
在 CPU 綜合體部分,參見來自 TechInsights 和 ChipRebel Apple A11 的圖(下圖,前者是 A12,後者是 A1)。A12 新的 CPU 核心變得更大了,而且這應該是蘋果幾代 A 系列晶片以來 CPU 佈局上變化最大的一次。同時,新“Vortex CPU”核心中 L1 快取翻了一倍,從 64KB 增加到 128KB。同時,SRAM 這塊也是之前的雙倍大小,其主要歸因於 L1 指令快取,因為現在已經加到到了 128KB。
在大核心方面,全新 A12 的 L1 從 64KB 躍升到了 128KB,這裡的增長是毫無疑問的。然而,轉到 L2 快取,AnandTech 認為這就有點奇怪了,特別是關於延遲方面。很明顯,在 3MB 範圍內,延遲會增加,現在直接到了 6MB 左右。需要注意的是,只有在完全隨機模式下訪問時,才會出現較慢的每秒 3MB 的行為。
AnandTech 不打算深入討論這個問題,而是深入系統快取服務的 6MB 以上區域。他們表示,一開始很難弄清楚這一點,因為整體延遲較低會造成偏移,但總的來說,延遲曲線在達到大多數 DRAM 延遲之前會進一步擴充套件到 4MB 左右。這與之前在晶片內部實際看到的情況是一致的,即新系統快取塊不僅加了一倍,而且容量也從 4MB 到 8MB 完全增加了一倍。
繼續看小核心,之前 A11 小核心的 L2 被限制在 512KB 以內,而 A12 則高達 1.5MB,然而 AnandTech 認為他們被快取記憶體的電源管理策略迷惑了,因為看看 A11 Mistral 核心延遲,可以看到他們在 768KB 和 1MB 之間明顯跳躍,但在 2MB 的 A12 核心中也可以看到了類似的跳躍。
AnandTech 表示,大核心的 L2 快取在 A11 和 A12 之間沒有看到任何結構上的變化,兩者都有 128 個 SRAM 巨集例項,被分成兩個塊。如果 L2 確實只有 6MB,那麼這意味著每個 SRAM 塊為 48KB。在小核心中使用了相同的 SRAM 巨集,A12 小核心 L2 已從 16 個增加到 32 個,看似增加一倍。然而,L2 實測延遲深度至少增加了三倍。總之,在 A12 上“Tempest 核心”似乎只有 512KB 可用,而 A12 實際物理系統快取可能達到了 8MB。
引入無損記憶體壓縮技術的 GPU 更強了
在 GPU 綜合體部分,AnandTech 稱對 A12 有很高的期望,不僅在效能方面,而且還包括在架構方面。去年有一份來自 Imagination 的官方新聞稿稱,蘋果已經通知他們未來在 15 至 24 個月內不再在新產品中使用其 IP,事實的確如此。這最終導致了 Imagination 股票價格暴跌,隨後公司被出售給一家公司,而蘋果則擁有了自主 GPU 設計。
蘋果宣佈 A11 GPU 自主設計時,其內部看上去仍然非常很像 Imagination 的衍生設計,因為其塊設計非常類似於之前 Rogue 那一代,仍然是 TBDR(基於平鋪的延期渲染器)設計,而這方面 IMG 擁有諸多專利。最重要的事實是,蘋果仍然公開支援其專有格式 PVRTC (PowerVR 紋理壓縮),這意味著其 GPU 仍然可能與 IMG 的 IP 有明顯關聯。在這裡,AnandTech 認為這不是通常所說的“乾淨”設計。
至於 A12 GPU,參見來自 TechInsights 和 ChipRebel Apple A11 的圖(下圖,前者是 A12,後者是 A1),其型號為 G11P,仍看到了一些非常明顯的類似於去年 A11 GPU 的設計,各個功能塊在很大程度上似乎位於相同的位置,並以類似的方式構造。
AnandTech 認為, 蘋果在 A12 GPU 上最大的進步是現在支援了無損記憶體壓縮技術。 他們表示,當初在釋出會上聽到這個訊息時,非常驚訝,因為這將意味著兩件事:首先之前蘋果 SoC 及 GPU 顯然沒有記憶體壓縮技術,再者現在增加該技術支援本身就足以顯著提升新 GPU 的效能。
記憶體壓縮,主要是指從 GPU 到主記憶體的幀緩衝區壓縮。在桌面領域,像 Nvidia 和 AMD 這樣的顯示卡提供這一功能已有很多年了,即使在記憶體頻寬沒有增加的情況下,它也能提高 GPU 的效能。智慧手機 GPU 同樣需要記憶體壓縮,這不只是因為移動 SoC 上的頻寬有限,而更重要的是由於高頻寬要求時可降低相關功耗。ARM 的 AFBC 幀快取壓縮技術一直是移動領域公開的機制,而且高通和 Imagination 等其他廠商也有自己一套的壓縮記憶體相關技術。
蘋果只在 A12 上介紹了這一功能,看起來似乎太晚了,但意義卻很重大。因為這意味著 A12 相比前一代能夠在效率和效能上獲得異於尋常的巨大提升。考慮到蘋果在釋出會上也表示新 GPU 效能提升顯著,所以引入記憶體壓縮技術此舉意義重大。
A12 CPU 核心頻率
在過去的幾代晶片中,蘋果一直在穩步提高晶片大核心的頻率,同時也提高微架構的 IPC 效能。AnandTech 對 A12 和 A11 的頻率特性做了快速測試,得出了下面對比的表格:
大核心方面,從 A11 到 A12,實際上最大的提升就是拉高了最大頻率,A11 的 Monsoon 大核心為 2380MHz,A12 的新 Vortex 大核心則提高到 2500MHz,不過在 ST 應用中這只是 5% 的頻率提升。到第二大執行緒的頻率,A11 和 A12 的頻率分別為 2325 和 2380MHz。至於第三執行緒的測試,A11 和 A12 的頻率排程有所不同,A11 已經下降到了 2083MHz,A12 則保持同樣的 2380,直到達到散熱極限才最終減速。
小核心方面,相較於 A11 的 Mistral 核心,A12 新的 Tempest 核心實際上更加保守。當 A11 只有一個小核心執行時,其最高頻率可以達到 1694MHz。而在新的 A12 晶片上,小核心最高頻率限制為最高 1587MHz。同時,當 4 個小內盒完全滿載時,頻率也進一步從 1587MHz 輕微降低到了 1538MHz。
記憶體延遲大大改善
正如前述,蘋果顯然在 A12 快取層次結構和儲存器子系統中投入了大量的工作。通過 AnandTech 提供的線性延遲測試圖,可以看到對於大核和小核的完全隨機延遲改善明顯,具體如下:
與 A11 的 Monsoon 大核心相比,A12 的 Vortex 核心雖然只高了 5%,但是 L2 記憶體延遲從 11.5ns 降到了到 8.8ns,這是 29% 的提升。這意味著現在新 Vortex 核心的 L2 快取記憶體可以在更少的週期內完成操作。在 Tempest 小核心方面,L2 週期延遲似乎保持不變,但在 L2 分割槽和電源管理方面又發生了很大的變化,允許訪問更大的 L2 物理塊。
AnandTech 只在 64MB 進行了測試深度測試,顯然在這個資料集中,延遲曲線並沒有變得平緩,但是可以看到 DRAM 的延遲已經有所改進。當小核心處於活動狀態時,記憶體控制器 DVFS 的最大頻率會提高,這可以解釋為什麼 Tempest 小核心的 DRAM 訪問存在較大差異,而當大核心有大執行緒執行時效能會更好。
A12 的系統快取在其行為設計上發生了一些重大的變化。不可否認,頻寬是快取層次結構的一部分,雖然 A12 相比 A11 有所減少,但延遲卻得到了很大改善。這裡主要可以歸因於 L2 預取器,或者系統快取端的預取器,包括延遲效能和流預取器數量都已經增加。
指令吞吐量和延遲時間
為了比較 Vortex 大核心的後端特性,AnandTech 測試了指令吞吐量。後端效能由執行單元的數量決定,延遲由設計質量決定。AnandTech 表示,A12 具有 6 個整數執行管道,其中 2 個是複雜的單元,還有 2 個載入/儲存單元,2 個分支埠和 3 個 FP/向量管道,這就等於是 13 個執行埠,遠超過 ARM 即將推出的 Cortex- A76,也比三星的 M3 也更寬。事實上,蘋果的微架構在通道寬度方面似乎遠遠超過了其他任何陣營,包括桌面 CPU。
A12 CPU 效能:達到桌面級水平
關於 CPU 效能的測試,AnandTech 選擇的是編譯的 SPEC 2006 這個軟體。在他們來看,SPEC 這個測試軟體權威性更足,並稱其為一個重要的行業標準化的 CPU 測試基準套件,這與一般測試 CPU 負載效能不同,所處理器的資料要大的多,也更復雜,重點測試系統的處理器,記憶體子系統和編譯器等多個不同的基準測試。
AnandTech 表示,雖然 GeekBench 4 已經成為當前非常受歡迎的行業基準軟體,但他們希望可以有一個完整的跨平臺的基準測試套件,而且不只是測試峰值效能。因此,SPE C2006 被選為更具有代表性的高效能的跨硬體的基準測試軟體,它能充分展示微體系結構的更多細節,特別是在記憶體子系統效能方面。
不過,AnandTech 也指出,由於他們編譯的 SPEC 2006 基準測試套件沒有得到 SPEC 官方驗證,因此接下來的測試的資料僅用於參考,而且效能測試是在可控的環境下進行的,並準備了幫助手機散熱的風扇,目的是保證 1 到 2 小時內的熱量不會影響測試。
關於測試之後製作的圖表,AnandTech 稱右側的資料越大表示 SoC/CPU 的效能越好,數字代表分數。而左側軸上,表示給定工作負載的能耗使用情況,左邊出來越長意味著需要更多的能耗,越短表示越節能,每瓦的平均功率指標相當重要,這裡用到了瓦和焦耳作單位。而在資料對比方面,選擇了之前做個測試的 A11、高通驍龍 845、驍龍 835、三星 Exynos 9810、Exynos 8895 等。
第一個測試從 SPECint 2006 工作負載開始:
從上圖可以看到,在大部分工作負載下,A12 的時鐘頻率比 A11 高了 5%。AnandTech 稱,考慮到無法真正鎖定 iOS 裝置上的頻率,所以這只是基準測試期間執行時頻率的假設而已, 在 SPECint 2006 測試中,A12 的平均表現比 A11 好約 24% 。
在 456.hmmer 和 464.h264ref 這兩項測試中 A12 晶片的提升最小。AnandTech 表示,這兩個是整個套件中瓶頸最多的測試專案,然而 A12 在這些方面似乎並沒有什麼大的提升,分數只有很小的漲幅,這主要還是得益於更高的頻率以及快取層次結構的改進。
在 445.gobmk 測試項 A12 的改進就相當大了,提升達到 27%。AnandTech 稱他們測出 A12 在快取記憶體行的儲存處理方式上確實有一些重大變化,而在分支預測精度上沒有顯著變化。不過,在 403.gcc、429.mcf、471.omnetpp、473.Astar 和 483.xalancbmk 這幾項對記憶體子系統效能測試方面,A12 效能提升就非常大了,提升幅度從 30% 到 42% 不等。很明顯,快取層次結構和記憶體子系統的改進再次得到回報,AnandTech 稱這是最近幾代效能飛躍最顯著的一次。
說到 SPECint 2006 測試中的能效方面,總的來說 A12 相比 A11 在能效上提升了 12%,但這只是在最高效能下減少了 12% 的能耗 ,AnandTech 表示若比較 A11 和 A12 兩代晶片在效能/功耗曲線上的變化,的確體現出了平均 24% 的效能提升,但在效能提升幅度最大的測試項中(也就是前面有關記憶體工作負載的測試),A12 的功耗其實是顯著上升的,所以儘管 7nm 工藝本身能效更高,但 A12 依然比新工藝節點更耗電。在整個 SPECint 2006 測試期間,此前 A11 的平均功率為 3.36W,而 A12 增加到了 3.64W。
再看上面第二個 SPECfp 2006 測試圖,AnandTech 還進行了有很多記憶體密集型的測試。 在 SPECfp 2006 測試中,A12 相比 A11 的效能提升平均達到了 28% 。在 433.milc 測試項效能上獲得了 75% 的顯著提升。同樣的情況還出現在 450.soplex 專案,AnandTech 表示,A12 出色的快取層次結構和記憶體儲存效能的組合使其效能大大提升了 40%。
470.lbm 這項測試充分展示了蘋果 A 系晶片與 ARM 或三星核心相比有多方面效能優勢,完全就是碾壓級別,A12 指令執行吞吐量的優勢為效能做出了重要貢獻。比較奇怪的是,高通以前的驍龍 820 晶片表現都還由於最近兩年的 SoC 晶片。
而關於能效方面,AnandTech 表示,A12 在 SPECfp 2006 測試中的表現與上面的 SPECint 2006 類似,效能躍升同功耗也有所增加,其中 433.milc 測試項的功耗從 A11 的 2.7W 提高到了 4.2W,這是 75% 的功耗增加。 就 SPECfp 2006 測試整體功耗而言,A11 是 3.65W,A12 增加到了 4.27W 。除了 482.sphinx3 測試項之外,上圖中所有專案的功耗都有所增加,最大值達到 5.35W。
測完 SPECfp 2006 和 SPECint 2006,AnandTech 放出了從 A9 到 A12 幷包含最新 Android 陣營 SoC 晶片的綜合性能橫向對比,如下圖:
AnandTech 表示,就總體而言,新 Vortex 核心和 SoC 記憶體子系統的架構改進,使得蘋果 A12 晶片比蘋果營銷所宣傳的效能優勢大得多,即便是與 Android 陣營最好的 SoC 相比,無論是效能上還是能效上的優勢都非常明顯。可以說,蘋果 SoC 比所有 Android 陣營的 SoC 晶片都具有更高能效,並且還能提供近兩倍的效能優勢。如果將 SoC 所用的功耗統一標準化,那麼蘋果 A12 的表現將領先 Android 陣營 SoC 三倍,無需對此感到驚訝。
做完兩項測試小結,AnandTech 還談到了競爭對手面對蘋果 A 系晶片時的境況如何。例如說,三星 Exynos 9810 晶片能耗是去年蘋果 A11 晶片的兩倍,但效能差距仍達到了 55%。有意思的是,AnandTech 聲稱,雖然不清楚 A12 的效能與 臺式 機 CPU 差距有多接近,但 根據之前一些測試資料對比發現,A12 在單執行緒效能方面已經優於某些 英特爾 中檔 Skylake CPU。
當然了,AnandTech 也沒有說得很絕對,他們稱很多測試要考慮到測試工具在各平臺編譯問題,以及 CPU 的頻率因素。但就當下的測試條件下,他們直言蘋果的移動 SoC 在 ST 應用某些方面效能優於桌面 CPU。
A12 小核 Tempest CPU 測試
蘋果公從 A10 晶片開始配備“能效”核心,也就是通常所說的小核心,從某種意義來說,這也是 A 系列晶片首次引入異構多核結構,這也驗證了 ARM 最初的設計方向,也就是通過單獨的低功耗物理核心有效地降低 SoC 的整體功耗。A12 的小核心 Tempest CPU 已經是第三代了,依然是完全異構獨立於大核心的設計。
AnandTech 表示,A12 的 Tempest CPU 架構與 A6 晶片的 Swift 微架構相似,蘋果應該是基於此設計將其移植到 64 位系統,並將其當做低功耗的 CPU 核心。Tempest CPU 的最高頻率可以達到 1587MHz,相比 A11 的 Mistal 小核心的 1694MHz 更低,所以在下面 SPEC 測試中,後者比前者快 6.7%,造成這樣的差距就是頻率的問題。
從整個測試來看,其實 A12 的小核心效能與去年 A11 的非常相近,而得益於 7 奈米的工藝製程,在 SPEC 2016 測試的過程中,Tempest CPU 能效相比 Mistal CPU 提升了 35%。不過,AnandTech 指出,其實 7 奈米工藝並不是提高 Tempest CPU 能效的關鍵,主要還是頻率更低的原因,如果在同頻的情況下可能功耗會更高,當前 Tempest CPU 與更高頻的 Mistal CPU 的效能測試得分差不多,主要得益於記憶體快取層次結構和記憶體子系統的改進。
在 FP 基準測試中,雖然 A12 的 Tempest CPU 比 A11 的 Mistal CPU 效能確實更優,但效率僅高出了 17%。與自家的大核相比,小核心僅提供了三分之一到四分之一的效能,只不過功耗功耗使用不到還不到一半。其實將這 A11 和 A12 的小核心與其他基於 ARM 設計的晶片相比,也沒有太多驚喜之處。
AnandTech 稱,最讓人驚喜之處應該是在 SPECint 測試中,A12 小核心的效能幾乎與 ARM 兩年前的高效能核心水平相當。更具體來說,在 SPEC 的整數測試中,Tempest CPU 相當於 2.1GHz 主頻的 Cortex-A73 核心。但在 SPECfp 測試中 A12 的小核心並不具優勢,因為沒有專門服務於浮點運算的資源,只是能效很高而已。
在這部分測試的最後,AnandTech 表示蘋果設計的 CPU 小核心效能比想象中好得多了,因為在 ARM Cortex-A55 上完成 SPEC 測試要花很長時間,根據不同的測試專案,兩者的效能差異是 2 - 3 倍。AnandTech 強調稱,其實 ARM 的小核心效能在很多工作負載著效能已經不足,這就是為什麼會有三叢集 CPU 架構的原因。就目前而言,小核心的最大效能與大核心的最低效能,都在朝著一個相同的方向發展,所以未來會怎樣還未知。
A12 神經網路引擎“理論”效能
新 A12 晶片最重要另一個改進就是神經網路引擎,蘋果宣稱這是內部自主設計的。正如在開頭部分看到的,當前神經網路引擎在整個晶片中已經佔據相當大一部分,其所佔面積與兩個 Vortex CPU 大核心接近。有意思的是,AnandTech 沒有太好的測試神經網路引擎的工具,所以目前只能選用國產測試工具魯大師,只是因為其 AI 效能測試支援跨平臺。
首先是 Inception V3 專案測試:
再者是 ResNet34 專案測試:
最後是 VGG16 專案測試:
總的來說,蘋果官方所述的 8 倍效能提升在上述稱成績中並沒有得到體現,分數顯示的是 4 倍到 6.5 倍提升。這裡有一個問題是,iPhone X 的 A11 效能與 iPhone 7 的 A10 非常接近,主要是因為蘋果在 GPU 上執行 CoreML,也許是因為 A11 的 NPU 未開放 API,所以測試工具無法真正執行測試。
華為麒麟 970 的 AI 人工智慧效能落後 A12 大約 2.5 倍,預計本月中旬華為新發布的麒麟 980 晶片應該能夠明顯縮小與 A12 的差距。高通的驍龍 845 處理器表現也不差,基本上與華為麒麟 970 的水平相當。另外,魯大師的 AI 效能測試使用的是 SNPE 框架進行理論加速,目前還不支援 NNAPI,所以谷歌 Pixel 2 和三星 Galaxy Note 9 在測試中成績差得可怕,因為只能回到 CPU 核心進行加速處理。
在 AI 效能測試的功耗方面,A12 在測試過程中功耗達到 5.5W。AnandTech 稱不清楚為何會有那麼高的功率,這高過了之前效能測試的平均功耗,例如 GPU 的功耗在 2.3W 到 5W 之間。不過蘋果願意將功率提到 5.5W,說明蘋果願意在 AI 效能上挑戰極限,追求最高的突發性能。
綜合系統性能
雖然綜合性能測試比較重要,AnandTech 稱他們也希望很好地利用各種規範,但是 iOS 平臺系統性能測試套件相比 Android 又少又糟糕,所以能做對比的也就網路瀏覽器測試。
首先是 Speedometer 2.0 測試,這是最新行業標準的 JavaScript 基準測試,可測試最常見和最新的 JS 框架效能。 在 Speedometer 2.0 測試中,A12 與 A11 相比效能大幅躍升了 31% 。對此 AnandTech 表示,蘋果自己營銷的效能資料其實遠低於新晶片的實測資料。當然了,安裝了 iOS 12 系統的裝置相比之前也有小福提升,這不僅得益於 iOS 排程處理負載方式的改變,還得益於蘋果所使用的 JS 引擎已進一步改進。
接著是 WebXPRT 3 測試,這也是一個瀏覽器測試工具,但工作負載情況更加廣泛和多樣化,包含了大量的處理測試。 在 WebXPRT 3 這項測試中,iPhone XS 比 iPhone X 強 11% 。同時,iOS 12 系統也讓老裝置在效能上得到了提升,其中 iPhone X 的得分從 134 分上升到了 147 分,即 10% 的提升,iPhone 7 也提升了 33%。
iOS 12 CPU 排程載入機制分析
蘋果所指的 iOS 12 系統將讓裝置效能有顯著提升,這主要歸功於的新排程機制,充分考慮了各個任務的負載方式。AnandTech 稱,iOS 系統的核心排程程式,通過跟蹤執行緒的執行時間,並將其歸納為某種利用率指標或度量,然後交給 DVFS 機制來排程。決定負載如何計算或負載如何隨時間變化的演算法,通常只需一些簡單的軟體決策即可,蘋果可以將其調整和設計到他們認為合適的方式。
由於 iOS 系統的核心是完全封閉的,所以很難剖析 iOS 12 與 iOS 11 相比究竟改變了什麼,為此 AnandTech 採用實際測量的方式來檢視排程機制的改變,其中相對簡單的測量方法,就是跟蹤負載從空閒到峰值效能的頻率,特別是 iOS 12 系統升級前後的對比。下面開始從搭載 A8 晶片的 iPhone 6 一直測量到 A12 晶片 iPhone XS。
首先從 A8 芯的 iPhone 6 開始,在 iOS 11上測量出了很奇怪的結果,因為從空閒到滿載效能的排程行為非常不尋常,重複了幾次結果還是一樣。A8 CPU 空閒時為 400MHz,並在此頻率停留了 110ms,接著躍至 600MHz,然後經過 10ms 再次提升到 1400MHz 的峰值頻率。不過,在 iOS 12 系統上排程行為呈現一種更為階ti 的形式,更早提前升頻,並且在 90ms 後達到峰值效能。
iPhone 6S 在 iOS 11 上的排程行為與 iPhone 6 明顯不同,A9 晶片的 DVFS 排程機制升頻非常慢。CPU 過了 435ms 才達到其最大頻率。不過,隨著 iOS 12 的更新,生頻到峰值頻率的時間已經被大幅削減到了 80ms,大大提高了短時互動下的效能。
iPhone 7 系的 A10 排程在 iOS 11 上與 A9 有相似的缺點,充分發揮峰值效能的時間需超過 400ms。不過在 iOS 12 系統中,iPhone 7 將這個時間減半,約為 210ms。看起來 A10 與 A9 相比更為保守,但這可能與小核心有關。畢竟看圖不難發現,Zephyr 小核心頻率最高峰值是 1100MHz,而曲線圖頻率突然下降到 758MHz,是因為此時小核心換到大核心,才會繼續升頻率,最後才是大核心的峰值效能。
在 iPhone 8 系和 X 的 A11 排程極致上,iOS 11 與 iOS 12 沒有太大的變化,兩個版本系統 A11 都能在 105ms 的範圍內升至全頻。請注意, 在 A11 之後,蘋果 A 系晶片迅速升到峰值頻率的時間比之前幾代都要短得多了。
最後是 iPhone XS 系的 A12 晶片,必然無法測量更新前的變化,因為出廠預裝 iOS 12 系統。不過可以看到,只需 108ms 的時間 A12 就能達到了峰值效能,從 Tempest 小核心轉移到 Vortex 大核心的時間也極短。
AnandTech 測完排程機制之後表示 ,iOS 12 在舊款 iPhone 上的效能排程與 iOS 存在明顯差異,至少測量就能非常直觀地發現 CPU 升頻曲線的變化 。對於 iPhone XS,日用效能上絕對沒有任何問題,速度已足夠快。AnandTech 還提到,他們日常使用的是 Android 手機,而且會完全關閉動畫效果,因為他們認為不關會影響裝置的速度,或者或嚴重掩蓋裝置的真實效能。然而,雖然 iOS 沒有辦法完全關閉動畫,但是 iPhone XS 依然能快速執行,毫無顧慮。
GPU 效能測試
GPU 的效能提升是 A12 的最大亮點之一,按照蘋果的說法,相比 A11 的 GPU 效能提高了 50%。AnandTech 表示,蘋果只是“簡單”額外添加了 1 個 GPU 核心(A11 有 3 個核心),並在 GPU 中引入無損記憶體壓縮技術,就能實現了效能大提升。其中,記憶體壓縮技術被 AnandTech 認為是現最助於提高 GPU 微架構效能的因素,聲稱引入記憶體壓縮絕對是一次巨大的轉變,但不可否認,蘋果花了很長時間才實現這點。
在進行效能測試之前,AnandTech 稱他們最大的疑問是 A12 最新 GPU 的峰值效能和峰值功耗如何。因為之前蘋果長期都會執行一些所謂“騷操作”,也就是在執行一段時間後,持續效能直接變為效能下降。
首先跑 3DMark Sling 3.1 物理測試,既考察 CPU 更強調 GPU 使用時的平臺整體功耗極限。在這一測試中,A12 相比 A11 有很大的進步,過去這項測試對蘋果 A 系晶片都不太理想,但是 A12 整體能效提升,效能也得到了一定提高,因此終於可以匹敵 ARM 陣營了。
再者是 3DMark 針對 GPU 圖形效能的測試部分,iPhone XS 相比去年的 iPhone X 的持續效能提升了 41% 。
GFXBench 測試
最近 Kishonti 釋出了最新 GFXBench 5 Aztec Ruins 測試工具,因此 AnandTech 將此測試套件作為選擇,新套件針更現代、更新,測試更復雜,同時新增的 Aztec 場景測試提供了更加複雜的效果,更強調 GPU 的運算效能,包括填充率、紋理、著色器效果和頻寬效能等。GFXBench 5 測試子項大概如下:
普通模式下的 Aztec Ruins 場景是一個要求不那麼高的新測試場景,所以蘋果 A12 晶片充分展示了其極高的峰值效能。 在 Aztec Ruins 場景普通模式中,A12 相比去年的 A11 提升了 51% 。不過,就 持續效能表現而言,峰值效能在幾分鐘後就迅速下降了,並逐步穩定下來,不過在持續效能方面,iPhone XS 的效能相比 iPhone X 仍提升了 61%。並且 A12 也能夠在持續效能表現上以 45% 的優勢擊敗 Android 陣營的旗艦晶片高通驍龍 845 。
高階模式下的 Aztec Ruins 場景要求就高得多,而且更復雜。不過,這份效能排名中 A12 的效能依然驚人,iPhone XS 的峰值效能仍非常出色,而且持續效能的跑分也不低。 在 Aztec Ruins 場景高階模式下,iPhone XS 持續效能同樣比 iPhone X 提升了 61%,而領先驍龍 845 的效能差縮減到了 31% ,相比普通模式略低了一些,可能在某些方面碰到瓶頸,但依然最強。
在 Manhattan 3.1 場景中,iPhone XS 的 GPU 效能相比 iPhone X 提升巨大,達到 75% 。AnandTech 表示,A12 取得這樣的成績不僅是因為 GPU 微架構的改進,還要加上 1 個額外的核心,以及全新的工藝節點,但重點還要歸功於新的記憶體壓縮技術 。
最後是 T-Rex 場景,A12 再次展示了 GPU 效能的巨大提升。 在 T-Rex 場景中,iPhone XS 持續效能相比 iPhone X 提升了 61%,並且傲視群雄 。
GPU 功耗
由於新的 Aztec Ruins 場景很多裝置還有相關資料,所以這一次 依然依賴於 Manhattan 3.1 場景和 T-Rex 場景測得的資料。A12 的 GPU 由於引入了記憶體壓縮技術,進一步降低了外部 DRAM 的功耗,相當於在高頻寬 3D 圖形負載下減少了 20%-30% 的功耗,而節省下來的功耗同樣可以轉換為更高的效能。
GFXBench Manhattan 3.1 場景下測試的功耗,下面數字顯示的是裝置整機功耗減去空閒功耗(包括螢幕功耗),在裝置保持 22 度以下的溫度時,峰值狀態下 A12 的 GPU 非常耗電,平均功率達到了近 6W,不過這仍不是 GPU 最高功耗,前面 3DMark 測試中(崩潰前)曾經達到 7.5W 左右。
AnandTech 表示,即便 A12 的 GPU 平均功耗不低,但其效率仍超過了所有 SoC 晶片,每瓦功率能夠提供的幀率達到前所未有的水平。不過,蘋果依然有所謂“騷操作”,僅 3 分鐘或者進行三次測試之後,GPU 效能就會因為節流降頻下降 25%。所以在下面的功耗表中,提供了“Warm”發熱狀態下的平均功耗,具體為 3.79W,但可以看出其每瓦能夠提供的效能仍然超過了所有 SoC。
在 T-Rex 場景測得功耗資料與上面在 Manhattan 3.1 場景下看到的情況差不多,保持裝置涼快也就是 22 度以下的溫度時,A12 的 GPU 峰值平均功率達到 6W 多一點。而在在執行 3 次之後,發熱的裝置再次將功率降低到 4W 以下。雖然效能也下降了 28%,但每瓦效能依然出色。
測完功耗之後 AnandTech 表示,A12 發熱時的功耗並不是是持續效能時的功耗,大多數裝置的在持續效能發揮時,功耗一般都控制在 3W-3.5W 的範圍內。A12 的 GPU 峰值效能和持續效能存在那麼明顯的差異,與蘋果為 GPU 設計的日常應對的場景,以及蘋果針對 A12 的 3D 圖形處理如何排程 GPU 負載有關。
蘋果針對 A12 的 GPU 設計了大量使用場景,例如在大多數應用中都會使用到 GPU 硬體加速進行相機影象處理,在這種用例中,GPU 的持續效能並不重要,因為只是短暫的負載工作,很快就處理完畢。對於節流降頻,AnandTech 認為蘋果需要做一些優化,畢竟在使用 iPhone XS 玩遊戲過程中不會喜歡發熱,應該通過某種必要的方式,來保證對持續效能有需求的遊戲或應用也能充分利用更高的持續效能。
最後,AnandTech 表示,其實除了發熱不久後降頻,以及無法持續太久峰值效能之外,蘋果最新的 A12 的 GPU 依然展示了行業最領先的效能和能效,至少可以說 iPhone XS 和 XS Max 目前是全球最好的遊戲移動裝置。
續航水平
測完了 A12,可能大家還想看看 A12 裝置的電池續航水平,AnandTech 也對此進行了測試。iPhone XS 配備了2658 mAh/10.13Wh 電池,iPhone XS MAX 的容量則為 3174 mAh/12.08Wh。可以看出,儘管這兩款手機都是大尺寸形狀的裝置,但在同尺寸裝置的競爭中,蘋果為它門配備的電池容量仍落後於競爭對手。
不可否認,螢幕最大的 iPhone XS Max 配備的電池已經是 iPhone 有史以來容量最大的一塊,但與其他手機廠商在同一規格下使用的 3500 - 4000mAh 相比,仍然相形見絀。正如前面在 A12 的 SPEC 測試中 AnandTech 所說的那樣,蘋果的 SoC 優勢之一就是在能效方面遙遙領先,所以這很大程度上彌補了電池容量不足的缺口。
AnandTech 測試續航的方面就是直接在 WiFi 下進行 web 網頁瀏覽測試,不過設定的是一種從混合到繁重的負載測試,讓裝置瀏覽多遍他們在 伺服器 上託管的一組網頁。測試中,針對一個 web 頁面會執行載入、暫停、滾動、暫停等操作,然後再繼續到另一個網頁,當完成一組頁面測試後再重複所有操作,測試中螢幕亮度是固定在 200 cd/m²。
在測試中 ,iPhone XS 的續航時間與 iPhone X 相比略有下降,減少了 19 分鐘 。儘管這 19 分鐘並不是天大的差距,但令人疑惑的問題還是來了:蘋果無論在釋出會上承諾 iPhone XS 續航相比 iPhone X 有所改善,尤其使用時間 iPhone XS 比 iPhone X 最長增加 30 分鐘,可為何沒有得到體現?不過,檢視蘋果官方頁面上網頁瀏覽續航,兩者確實同為 12 小時,這裡 AnandTech 的測試要複雜和嚴苛一些,所以續航縮減到了 10 小時內,只是 20 分鐘的差距真的有點明顯了。
iPhone XS Max 玩也續航測試最後的結果是 10 小時 3 分鐘。雖然這樣的成績不錯了,但卻比 iPhone 8 Plus 的 11.83 小時下降明顯。當然了,這裡的差異合理化會更容易解釋一些,儘管 AnandTech 測試的網頁是多樣性的,很多暗色或深色頁面,但不管怎樣,XS Max 採用的 OLED 螢幕在瀏覽白背景頁面時必然更耗電,而且機子螢幕面積也比 iPhone 8 Plus 更大,所以增加的電池容量不足以抵消面板耗電的增加。
AnandTech 比較糾結為什麼 iPhone XS 相比 iPhone X 續航時間下降了 20 分鐘。為了進一步證實,他們還給 iPhone X 升級了 iOS 12 重新測試,確保測試條件統一而不影響結果。有趣的是,升級 iOS 12 之後 iPhone X 得到的成績比 1 月份測試時還少了 10 分鐘,不過這 10 分鐘的差異可以忽略不計,可以肯定 iOS 版本不是影響續航的主要因素。
AnandTech 稱他們在對 A12 測試時已經明確,該晶片在工作負載方面缺少更高效了,即使帶來了更高的效能,這也應該是相對安全的耗電水平。不過,峰值和空閒之外各個階段的效能耗電量無法知曉,也就無法驗證是否是中等效能狀態下功耗更大,畢竟中等效能也是 CPU 執行大量運算階段。
另外,AnandTech 還進行了另一種假設,認為非常有可能是連線性因素所致,雖然不清楚全新來自博通的 Broadcom BCM4377 WiFi 組合晶片能效如何,但關鍵是 iPhone XS 使用的不再是高通基帶,反而是來自英特爾的 XMM 7560 基帶,這可能是影響續航的關鍵因素之一。
為什麼這麼說呢?AnandTech 解釋稱,幾年前,由於移動運營商的基帶基站沒有啟用 CDRX,所以遇到了一些嚴重的配置錯誤問題,因此他們基本上放棄了 LTE 續航測試,畢竟這導致測試華為裝置時續航下降了近 20-30%。事實上,手機續航測試比想象中要困難得多,如果沒有受控的環境,就不要輕易執行這項測試。
總的來說,iPhone XS 和 XS Max 電池續航水平還是是不錯的,只是並沒有達到蘋果所宣傳的改進,但這其中涉及的不確定性太多了。
小結
最後在評測的小結階段,AnandTech 表示,蘋果 A12 晶片是 SoC 中的怪獸。儘管 A11 已經在效能和能效方面擊敗了競爭對手,但 A12 在這方面卻加倍努力,這要歸功於蘋果世界級的設計團隊,他們能夠從 CPU 微架構中擠出更多的提升空間。
A12 Vortex CPU 的記憶體子系統獲得了巨大的提升,這使得 A12 在很多工作負載下獲得了顯著的效能提升。蘋果的營銷部門實際上低估了 CPU 方面的改進,只報了 15% 提升。AnandTech 估計,A12 的 CPU 在很多負載測試下的效能會提高 40% 左右,在某些情況下甚至會有更大的提升。蘋果的 CPU 現在已經有了非常高的效能,所以更期待未來幾年的會如何發展,以及這對於蘋果的非移動產品將意味著什麼。
在 GPU 方面,蘋果官宣的提升確實在承諾的數字之內,但在持續效能表現方面超過了承諾的數字。新 GPU 看似去年的迭代升級,但是添加了第四個核心,並新增了無損記憶體壓縮技術,這一重要的改進將 GPU 效能提升到了新的水平。GPU 方面 AnandTech 認為蘋果真的要改進節流降頻機制,不是完全不節流,而是應該更少節流,因為直接開放效能上限會非常耗電,並且在遊戲的最初幾分鐘就會給手機帶來很大的發熱量。
在電池續航方面,iPhone XS 在網頁瀏覽測試中相比 iPhone X 並沒有提升,在一定程度上令人驚訝。這不確定這是否與 A12 某種隱性的低能效有關,或者可能與新的 WiFi 晶片或蜂窩調變解調器有關。對於英特爾基帶,AnandTech 稱他們將會花些時間討論這個話題,並重新驗證續航時間。
對於 iPhone XS Max,電池續航時間低於 iPhone 8 Plus 其實不足為奇,畢竟 OLED 螢幕的能效低於去年 iPhone 配備的 LCD 顯示屏,而電池容量的增加並不足以抵消這一點。對於那些認為 iPhone XS Max 大尺寸大電池續航就更好的使用者而言,這是需要注意的地方。總之,綜合來看,iPhone XS 和 XS Max 是蘋果迄今為止釋出過的最好的手機。