當前位置:首頁 > 消費電子 > 消費電子
[導讀]iPhone XS、iPhone XS Max 發(fā)布一個多月啦,而這幾款手機搭載的A12處理器成為其最大的亮點之一,作為第一枚商用的7nm芯片,到底又多強大呢?本文將從多個方面來闡述A12處理器的性能、結(jié)構和功能。

iPhone XS、iPhone XS Max 發(fā)布一個多月啦,而這幾款手機搭載的A12處理器成為其最大的亮點之一,作為第一枚商用的7nm芯片,到底又多強大呢?本文將從多個方面來闡述A12處理器的性能、結(jié)構和功能。

上個月,蘋果正式推出新一代iPhone,包括iPhone XS、iPhone XS Max及iPhone XR。按照蘋果的宣傳,iPhone XS系列是自家迄今為止最先進的新一代iPhone,實現(xiàn)了智能手機面向未來的一次巨大跨越。不過,三款新品都搭載了強大的A12仿生芯片。對于這枚芯片蘋果聲稱,A12仿生是iPhone迄今最智能、最強大的芯片,采用開創(chuàng)性的7納米芯片,具有更節(jié)能的設計,提供出眾的性能表現(xiàn)。

 

 

具體到A12仿生芯片內(nèi)部和性能,蘋果沒有非常詳細的講解,只是簡單的表示A12仿生采用六核心融合架構,與A11仿生相比,兩個性能核心的速度提升最高可達15%,四個能效核心的節(jié)能最高可達50%,同時蘋果自主設計的新四核心圖形處理器,其圖形性能提升最高可達50%。

那么,究竟蘋果口中所說的A12仿生芯片與上一代相比達到宣傳的性能提升嗎?CPU和GPU實際性能如何呢?只是iPhone迄今為止最強大而已嗎?與安卓陣營的SoC芯片相比又如何呢?近日,權威評測站AnandTech對A12進行了相當詳細的評測,并認為A12是當前移動領域最強的芯片,我們來看看這份評測報告中講述了些什么。

第一枚商用的7納米芯片結(jié)構分析

AnandTech表示,在過去的幾年里,蘋果的芯片設計團隊始終引領行業(yè)架構設計和制造工藝。Apple A12是蘋果又一次飛躍,因為它是全球第一枚商用的7nm芯片。

當談及工藝制程,一般來說,數(shù)字越小,晶體管就越小。盡管近些年更先進的工藝節(jié)點已不等于實際更小的物理尺寸,或者說兩者無必要關聯(lián)的意義,但依然可以代表密度的提升。因此,在更先進工藝的芯片內(nèi),總是能裝入更多的晶體管。

此前,另一專注芯片結(jié)構解析的網(wǎng)站TechInsights公布了關于蘋果A12的內(nèi)部圖片,因此AnandTech據(jù)此發(fā)布了一篇簡要分析。

 

 

AnandTech稱,12仍遵循此前蘋果SoC芯片的布局結(jié)構,在右邊可以看到GPU集群,內(nèi)有四個GPU核心和共享邏輯。而在下邊則是CPU的復雜結(jié)構,2個大CPU核心靠中間偏左,在其靠右一旁是更大的L2緩存,然后緊挨著4個小CPU核心以及為其配置的L2緩存。

芯片中間是4大塊SRAM,作為系統(tǒng)緩存的一部分,位于內(nèi)存控制器及內(nèi)部系統(tǒng)互連和塊儲存器子系統(tǒng)之間,主要當做SoC范圍緩存層的作用。蘋果利用這塊充分實現(xiàn)節(jié)能功能,因為DRAM內(nèi)存交換在能耗使用方面一點不小,直接在芯片內(nèi)緩存內(nèi)容可以減少大量的能耗,還能增強性能。

蘋果A12芯片的系統(tǒng)緩存發(fā)生了自A7推出以來最大的變化,布局上的巨大變化也相當于這塊功能上的巨大變化,現(xiàn)在可以清楚地看到這一部被分離成明顯的四塊。在之前蘋果的SoC芯片如A11或A10上,系統(tǒng)緩存看起來更像一個邏輯塊,似乎是兩塊,如今塊數(shù)增加可能意味著這部分的性能發(fā)生了非常大的變化。

最后,A12芯片最重要的變化之一是NPU神經(jīng)網(wǎng)絡引擎的一次重大改造。針對這部分,蘋果官方聲稱已經(jīng)從A11的雙核設計轉(zhuǎn)變?yōu)槿碌陌撕嗽O計。去年據(jù)一些傳聞了解,蘋果的NPU設計似乎來自CEVA IP,不過這點從未得到完全的確認,因為蘋果也不希望這其中的細節(jié)被人所知,而且官方的營銷材料多次提到“Apple-designed”,強調(diào)這是蘋果內(nèi)部自主IP。

A12采用了8核設計,其實際的理論性能提升接近8倍,從A11的600GigaOPs增加到A12的5TeraOPs。通過對比A11到A12大小的變化,可看到臺積電新7nm制程節(jié)點帶來的好處。需要注意的是,芯片內(nèi)幾乎所有的IP塊都發(fā)生了變化,所以用很難做有效的對比,尤其是確定新制程對密度提高是多少。

 

 

盡管如此,如果將單個GPU核心作為對比的參考,不難發(fā)現(xiàn),A12與A11相比,其尺寸減少了37%。很明顯,新的工藝制程的確幫助蘋果在A12內(nèi)塞進了更多的GPU核心,而且GPU內(nèi)核在A12中真的非常小。

CPU部分更大了

在CPU綜合體部分,參見來自TechInsights和ChipRebel Apple A11的圖(下圖,前者是A12,后者是A11)。A12新的CPU核心變得更大了,而且這應該是蘋果幾代A系列芯片以來CPU布局上變化最大的一次。同時,新“Vortex CPU”核心中L1緩存翻了一倍,從64KB增加到128KB。同時,SRAM這塊也是之前的雙倍大小,其主要歸因于L1指令緩存,因為現(xiàn)在已經(jīng)加到到了128KB。

 

 

在大內(nèi)核方面,全新A12的L1從64KB躍升到了128KB,這里的增長是毫無疑問的。然而,轉(zhuǎn)到L2緩存,AnandTech認為這就有點奇怪了,特別是關于延遲方面。很明顯,在3MB范圍內(nèi),延遲會增加,現(xiàn)在直接到了6MB左右。需要注意的是,只有在完全隨機模式下訪問時,才會出現(xiàn)較慢的每秒3MB的行為。

 

 

AnandTech不打算深入討論這個問題,而是深入系統(tǒng)緩存服務的6MB以上區(qū)域。他們表示,一開始很難弄清楚這一點,因為整體延遲較低會造成偏移,但總的來說,延遲曲線在達到大多數(shù)DRAM延遲之前會進一步擴展到4MB左右。這與之前在芯片內(nèi)部實際看到的情況是一致的,即新系統(tǒng)緩存塊不僅加了一倍,而且容量也從4MB到8MB完全增加了一倍。

繼續(xù)看小內(nèi)核,之前A11小內(nèi)核的L2被限制在512KB以內(nèi),而A12則高達1.5MB,然而AnandTech認為他們被高速緩存的電源管理策略迷惑了,因為看看A11 Mistral核心延遲,可以看到他們在768KB和1MB之間明顯跳躍,但在2MB的A12內(nèi)核中也可以看到了類似的跳躍。

 

 

AnandTech表示,大核心的L2緩存在A11和A12之間沒有看到任何結(jié)構上的變化,兩者都有128個SRAM宏實例,被分成兩個塊。如果L2確實只有6MB,那么這意味著每個SRAM塊為48KB。在小內(nèi)核中使用了相同的SRAM宏,A12小內(nèi)核L2已從16個增加到32個,看似增加一倍。然而,L2實測延遲深度至少增加了三倍??傊贏12上“Tempest核心”似乎只有512KB可用,而A12實際物理系統(tǒng)緩存可能達到了8MB。

引入無損內(nèi)存壓縮技術的GPU更強了

在GPU綜合體部分,AnandTech稱對A12有很高的期望,不僅在性能方面,而且還包括在架構方面。去年有一份來自Imagination的官方新聞稿稱,蘋果已經(jīng)通知他們未來在15至24個月內(nèi)不再在新產(chǎn)品中使用其IP,事實的確如此。這最終導致了Imagination股票價格暴跌,隨后公司被出售給一家公司,而蘋果則擁有了自主GPU設計。

蘋果宣布A11 GPU自主設計時,其內(nèi)部看上去仍然非常很像Imagination的衍生設計,因為其塊設計非常類似于之前Rogue那一代,仍然是TBDR(基于平鋪的延期渲染器)設計,而這方面IMG擁有諸多專利。最重要的事實是,蘋果仍然公開支持其專有格式PVRTC (PowerVR紋理壓縮),這意味著其GPU仍然可能與IMG的IP有明顯關聯(lián)。在這里,AnandTech認為這不是通常所說的“干凈”設計。

至于A12 GPU,參見來自TechInsights和ChipRebel Apple A11的圖(下圖,前者是A12,后者是A1),其型號為G11P,仍看到了一些非常明顯的類似于去年A11 GPU的設計,各個功能塊在很大程度上似乎位于相同的位置,并以類似的方式構造。

 

 

AnandTech認為,蘋果在A12 GPU上最大的進步是現(xiàn)在支持了無損內(nèi)存壓縮技術。他們表示,當初在發(fā)布會上聽到這個消息時,非常驚訝,因為這將意味著兩件事:首先之前蘋果SoC及GPU顯然沒有內(nèi)存壓縮技術,再者現(xiàn)在增加該技術支持本身就足以顯著提升新GPU的性能。

內(nèi)存壓縮,主要是指從GPU到主內(nèi)存的幀緩沖區(qū)壓縮。在桌面領域,像Nvidia和AMD這樣的顯卡提供這一功能已有很多年了,即使在內(nèi)存帶寬沒有增加的情況下,它也能提高GPU的性能。智能手機GPU同樣需要內(nèi)存壓縮,這不只是因為移動SoC上的帶寬有限,而更重要的是由于高帶寬要求時可降低相關功耗。ARM的AFBC幀緩存壓縮技術一直是移動領域公開的機制,而且高通和Imagination等其他廠商也有自己一套的壓縮內(nèi)存相關技術。

蘋果只在A12上介紹了這一功能,看起來似乎太晚了,但意義卻很重大。因為這意味著A12相比前一代能夠在效率和性能上獲得異于尋常的巨大提升??紤]到蘋果在發(fā)布會上也表示新GPU性能提升顯著,所以引入內(nèi)存壓縮技術此舉意義重大。

A12 CPU內(nèi)核頻率

在過去的幾代芯片中,蘋果一直在穩(wěn)步提高芯片大內(nèi)核的頻率,同時也提高微架構的IPC性能。AnandTech對A12和A11的頻率特性做了快速測試,得出了下面對比的表格:

 

 

大內(nèi)核方面,從A11到A12,實際上最大的提升就是拉高了最大頻率,A11的Monsoon大核心為2380MHz,A12的新Vortex大核心則提高到2500MHz,不過在ST應用中這只是5%的頻率提升。到第二大線程的頻率,A11和A12的頻率分別為2325和2380MHz。至于第三線程的測試,A11和A12的頻率調(diào)度有所不同,A11已經(jīng)下降到了2083MHz,A12則保持同樣的2380,直到達到散熱極限才最終減速。

小內(nèi)核方面,相較于A11的Mistral內(nèi)核,A12新的Tempest核心實際上更加保守。當A11只有一個小內(nèi)核運行時,其最高頻率可以達到1694MHz。而在新的A12芯片上,小內(nèi)核最高頻率限制為最高1587MHz。同時,當4個小內(nèi)盒完全滿載時,頻率也進一步從1587MHz輕微降低到了1538MHz。

內(nèi)存延遲大大改善

正如前述,蘋果顯然在A12緩存層次結(jié)構和儲存器子系統(tǒng)中投入了大量的工作。通過AnandTech提供的線性延遲測試圖,可以看到對于大核和小核的完全隨機延遲改善明顯,具體如下:

 

 

與A11的Monsoon大內(nèi)核相比,A12的Vortex核心雖然只高了5%,但是L2內(nèi)存延遲從11.5ns降到了到8.8ns,這是29%的提升。這意味著現(xiàn)在新Vortex核心的L2高速緩存可以在更少的周期內(nèi)完成操作。在Tempest小核心方面,L2周期延遲似乎保持不變,但在L2分區(qū)和電源管理方面又發(fā)生了很大的變化,允許訪問更大的L2物理塊。

AnandTech只在64MB進行了測試深度測試,顯然在這個數(shù)據(jù)集中,延遲曲線并沒有變得平緩,但是可以看到DRAM的延遲已經(jīng)有所改進。當小內(nèi)核處于活動狀態(tài)時,內(nèi)存控制器DVFS的最大頻率會提高,這可以解釋為什么Tempest小內(nèi)核的DRAM訪問存在較大差異,而當大內(nèi)核有大線程運行時性能會更好。

A12的系統(tǒng)緩存在其行為設計上發(fā)生了一些重大的變化。不可否認,帶寬是緩存層次結(jié)構的一部分,雖然A12相比A11有所減少,但延遲卻得到了很大改善。這里主要可以歸因于L2預取器,或者系統(tǒng)緩存端的預取器,包括延遲性能和流預取器數(shù)量都已經(jīng)增加。

指令吞吐量和延遲時間

為了比較Vortex大內(nèi)核的后端特性,AnandTech測試了指令吞吐量。后端性能由執(zhí)行單元的數(shù)量決定,延遲由設計質(zhì)量決定。AnandTech表示,A12具有6個整數(shù)執(zhí)行管道,其中2個是復雜的單元,還有2個加載/存儲單元,2個分支端口和3個FP/矢量管道,這就等于是13個執(zhí)行端口,遠超過ARM即將推出的Cortex- A76,也比三星的M3也更寬。事實上,蘋果的微架構在通道寬度方面似乎遠遠超過了其他任何陣營,包括桌面CPU。

 

 

A12 CPU性能:達到桌面級水平

關于CPU性能的測試,AnandTech選擇的是編譯的SPEC 2006這個軟件。在他們來看,SPEC這個測試軟件權威性更足,并稱其為一個重要的行業(yè)標準化的CPU測試基準套件,這與一般測試CPU負載性能不同,所處理器的數(shù)據(jù)要大的多,也更復雜,重點測試系統(tǒng)的處理器,內(nèi)存子系統(tǒng)和編譯器等多個不同的基準測試。

AnandTech表示,雖然GeekBench 4已經(jīng)成為當前非常受歡迎的行業(yè)基準軟件,但他們希望可以有一個完整的跨平臺的基準測試套件,而且不只是測試峰值性能。因此,SPE C2006被選為更具有代表性的高性能的跨硬件的基準測試軟件,它能充分展示微體系結(jié)構的更多細節(jié),特別是在內(nèi)存子系統(tǒng)性能方面。

不過,AnandTech也指出,由于他們編譯的SPEC 2006基準測試套件沒有得到SPEC官方驗證,因此接下來的測試的數(shù)據(jù)僅用于參考,而且性能測試是在可控的環(huán)境下進行的,并準備了幫助手機散熱的風扇,目的是保證1到2小時內(nèi)的熱量不會影響測試。

關于測試之后制作的圖表,AnandTech稱右側(cè)的數(shù)據(jù)越大表示SoC/CPU的性能越好,數(shù)字代表分數(shù)。而左側(cè)軸上,表示給定工作負載的能耗使用情況,左邊出來越長意味著需要更多的能耗,越短表示越節(jié)能,每瓦的平均功率指標相當重要,這里用到了瓦和焦耳作單位。而在數(shù)據(jù)對比方面,選擇了之前做個測試的A11、高通驍龍845、驍龍835、三星Exynos 9810、Exynos 8895等。

第一個測試從SPECint 2006工作負載開始:

 

 

從上圖可以看到,在大部分工作負載下,A12的時鐘頻率比A11高了5%。AnandTech稱,考慮到無法真正鎖定iOS設備上的頻率,所以這只是基準測試期間運行時頻率的假設而已,在SPECint 2006測試中,A12的平均表現(xiàn)比A11好約24%。

在456.hmmer和464.h264ref這兩項測試中A12 芯片的提升最小。AnandTech表示,這兩個是整個套件中瓶頸最多的測試項目,然而A12在這些方面似乎并沒有什么大的提升,分數(shù)只有很小的漲幅,這主要還是得益于更高的頻率以及緩存層次結(jié)構的改進。

在445.gobmk測試項A12的改進就相當大了,提升達到27%。AnandTech稱他們測出A12在高速緩存行的存儲處理方式上確實有一些重大變化,而在分支預測精度上沒有顯著變化。不過,在403.gcc、429.mcf、471.omnetpp、473.Astar和483.xalancbmk這幾項對內(nèi)存子系統(tǒng)性能測試方面,A12性能提升就非常大了,提升幅度從30%到42%不等。很明顯,緩存層次結(jié)構和內(nèi)存子系統(tǒng)的改進再次得到回報,AnandTech稱這是最近幾代性能飛躍最顯著的一次。

說到 SPECint 2006測試中的能效方面,總的來說A12相比A11在能效上提升了12%,但這只是在最高性能下減少了12%的能耗,AnandTech表示若比較A11和A12兩代芯片在性能/功耗曲線上的變化,的確體現(xiàn)出了平均24%的性能提升,但在性能提升幅度最大的測試項中(也就是前面有關內(nèi)存工作負載的測試),A12的功耗其實是顯著上升的,所以盡管7nm工藝本身能效更高,但A12依然比新工藝節(jié)點更耗電。在整個SPECint 2006測試期間,此前A11的平均功率為3.36W,而A12增加到了3.64W。

 

 

再看上面第二個SPECfp 2006測試圖,AnandTech還進行了有很多內(nèi)存密集型的測試。在SPECfp 2006測試中,A12相比A11的性能提升平均達到了28%。在433.milc測試項性能上獲得了75%的顯著提升。同樣的情況還出現(xiàn)在450.soplex項目,AnandTech表示,A12出色的緩存層次結(jié)構和內(nèi)存存儲性能的組合使其性能大大提升了40%。

470.lbm這項測試充分展示了蘋果A系芯片與ARM或三星內(nèi)核相比有多方面性能優(yōu)勢,完全就是碾壓級別,A12指令執(zhí)行吞吐量的優(yōu)勢為性能做出了重要貢獻。比較奇怪的是,高通以前的驍龍820芯片表現(xiàn)都還優(yōu)于最近兩年的SoC芯片。

而關于能效方面,AnandTech表示,A12在SPECfp 2006測試中的表現(xiàn)與上面的SPECint 2006類似,性能躍升同功耗也有所增加,其中433.milc測試項的功耗從A11的2.7W提高到了4.2W,這是75%的功耗增加。就SPECfp 2006測試整體功耗而言,A11是3.65W,A12增加到了4.27W。除了482.sphinx3測試項之外,上圖中所有項目的功耗都有所增加,最大值達到5.35W。

測完SPECfp 2006和SPECint 2006,AnandTech放出了從A9到A12并包含最新Android陣營SoC芯片的綜合性能橫向?qū)Ρ龋缦聢D:

 

 

AnandTech表示,就總體而言,新Vortex內(nèi)核和SoC內(nèi)存子系統(tǒng)的架構改進,使得蘋果A12芯片比蘋果營銷所宣傳的性能優(yōu)勢大得多,即便是與Android陣營最好的SoC相比,無論是性能上還是能效上的優(yōu)勢都非常明顯。可以說,蘋果SoC比所有Android陣營的SoC芯片都具有更高能效,并且還能提供近兩倍的性能優(yōu)勢。如果將SoC所用的功耗統(tǒng)一標準化,那么蘋果A12的表現(xiàn)將領先Android陣營SoC三倍,無需對此感到驚訝。

 

 

做完兩項測試小結(jié),AnandTech還談到了競爭對手面對蘋果A系芯片時的境況如何。例如說,三星Exynos 9810芯片能耗是去年蘋果A11芯片的兩倍,但性能差距仍達到了55%。有意思的是,AnandTech聲稱,雖然不清楚A12的性能與臺式機CPU差距有多接近,但根據(jù)之前一些測試數(shù)據(jù)對比發(fā)現(xiàn),A12在單線程性能方面已經(jīng)優(yōu)于某些英特爾中檔Skylake CPU。

當然了,AnandTech也沒有說得很絕對,他們稱很多測試要考慮到測試工具在各平臺編譯問題,以及CPU的頻率因素。但就當下的測試條件下,他們直言蘋果的移動SoC在ST應用某些方面性能優(yōu)于桌面CPU。

A12小核Tempest CPU測試

蘋果公從A10芯片開始配備“能效”核心,也就是通常所說的小核心,從某種意義來說,這也是A系列芯片首次引入異構多核結(jié)構,這也驗證了ARM最初的設計方向,也就是通過單獨的低功耗物理內(nèi)核有效地降低SoC的整體功耗。A12的小內(nèi)核Tempest CPU已經(jīng)是第三代了,依然是完全異構獨立于大內(nèi)核的設計。

AnandTech表示,A12的Tempest CPU架構與A6芯片的Swift微架構相似,蘋果應該是基于此設計將其移植到64位系統(tǒng),并將其當做低功耗的CPU核心。Tempest CPU的最高頻率可以達到1587MHz,相比A11的Mistal小內(nèi)核的1694MHz更低,所以在下面SPEC測試中,后者比前者快6.7%,造成這樣的差距就是頻率的問題。

 

 

從整個測試來看,其實A12的小內(nèi)核性能與去年A11的非常相近,而得益于7納米的工藝制程,在SPEC 2016測試的過程中,Tempest CPU能效相比Mistal CPU提升了35%。不過,AnandTech指出,其實7納米工藝并不是提高Tempest CPU能效的關鍵,主要還是頻率更低的原因,如果在同頻的情況下可能功耗會更高,當前Tempest CPU與更高頻的Mistal CPU的性能測試得分差不多,主要得益于內(nèi)存緩存層次結(jié)構和內(nèi)存子系統(tǒng)的改進。

在FP基準測試中,雖然A12的Tempest CPU比A11的Mistal CPU性能確實更優(yōu),但效率僅高出了17%。與自家的大核相比,小內(nèi)核僅提供了三分之一到四分之一的性能,只不過功耗使用還不到一半。其實將這A11和A12的小內(nèi)核與其他基于ARM設計的芯片相比,也沒有太多驚喜之處。

 

 

AnandTech稱,最讓人驚喜之處應該是在SPECint測試中,A12小內(nèi)核的性能幾乎與ARM兩年前的高性能內(nèi)核水平相當。更具體來說,在SPEC的整數(shù)測試中,Tempest CPU相當于2.1GHz主頻的Cortex-A73內(nèi)核。但在SPECfp測試中A12的小內(nèi)核并不具優(yōu)勢,因為沒有專門服務于浮點運算的資源,只是能效很高而已。

在這部分測試的最后,AnandTech表示蘋果設計的CPU小內(nèi)核性能比想象中好得多了,因為在ARM Cortex-A55上完成SPEC測試要花很長時間,根據(jù)不同的測試項目,兩者的性能差異是2 - 3倍。AnandTech強調(diào)稱,其實ARM的小內(nèi)核性能在很多工作負載著性能已經(jīng)不足,這就是為什么會有三叢集CPU架構的原因。就目前而言,小內(nèi)核的最大性能與大內(nèi)核的最低性能,都在朝著一個相同的方向發(fā)展,所以未來會怎樣還未知。

A12神經(jīng)網(wǎng)絡引擎“理論”性能

新A12芯片最重要另一個改進就是神經(jīng)網(wǎng)絡引擎,蘋果宣稱這是內(nèi)部自主設計的。正如在開頭部分看到的,當前神經(jīng)網(wǎng)絡引擎在整個芯片中已經(jīng)占據(jù)相當大一部分,其所占面積與兩個Vortex CPU大內(nèi)核接近。有意思的是,AnandTech沒有太好的測試神經(jīng)網(wǎng)絡引擎的工具,所以目前只能選用國產(chǎn)測試工具魯大師,只是因為其AI性能測試支持跨平臺。

首先是Inception V3項目測試:

 

 

再者是ResNet34項目測試:

 

 

最后是VGG16項目測試:

 

 

總的來說,蘋果官方所述的8倍性能提升在上述稱成績中并沒有得到體現(xiàn),分數(shù)顯示的是4倍到6.5倍提升。這里有一個問題是,iPhone X的A11性能與iPhone 7的A10非常接近,主要是因為蘋果在GPU上執(zhí)行CoreML,也許是因為A11的NPU未開放API,所以測試工具無法真正執(zhí)行測試。

華為麒麟970的AI人工智能性能落后A12大約2.5倍,預計本月中旬華為新發(fā)布的麒麟980芯片應該能夠明顯縮小與A12的差距。高通的驍龍845處理器表現(xiàn)也不差,基本上與華為麒麟970的水平相當。另外,魯大師的AI性能測試使用的是SNPE框架進行理論加速,目前還不支持NNAPI,所以谷歌Pixel 2和三星Galaxy Note 9在測試中成績差得可怕,因為只能回到CPU內(nèi)核進行加速處理。

在AI性能測試的功耗方面,A12在測試過程中功耗達到5.5W。AnandTech稱不清楚為何會有那么高的功率,這高過了之前性能測試的平均功耗,例如GPU的功耗在2.3W到5W之間。不過蘋果愿意將功率提到5.5W,說明蘋果愿意在AI性能上挑戰(zhàn)極限,追求最高的突發(fā)性能。

綜合系統(tǒng)性能

雖然綜合性能測試比較重要,AnandTech稱他們也希望很好地利用各種規(guī)范,但是iOS平臺系統(tǒng)性能測試套件相比Android又少又糟糕,所以能做對比的也就網(wǎng)絡瀏覽器測試。

首先是Speedometer 2.0測試,這是最新行業(yè)標準的JavaScript基準測試,可測試最常見和最新的JS框架性能。在Speedometer 2.0測試中,A12與A11相比性能大幅躍升了31%。對此AnandTech表示,蘋果自己營銷的性能數(shù)據(jù)其實遠低于新芯片的實測數(shù)據(jù)。當然了,安裝了iOS 12系統(tǒng)的設備相比之前也有小福提升,這不僅得益于iOS調(diào)度處理負載方式的改變,還得益于蘋果所使用的JS引擎已進一步改進。

 

 

接著是WebXPRT 3測試,這也是一個瀏覽器測試工具,但工作負載情況更加廣泛和多樣化,包含了大量的處理測試。在WebXPRT 3這項測試中,iPhone XS比iPhone X強11%。同時,iOS 12系統(tǒng)也讓老設備在性能上得到了提升,其中iPhone X的得分從134分上升到了147分,即10%的提升,iPhone 7也提升了33%。

 

 

iOS 12 CPU調(diào)度加載機制分析

蘋果所指的iOS 12系統(tǒng)將讓設備性能有顯著提升,這主要歸功于的新調(diào)度機制,充分考慮了各個任務的負載方式。AnandTech稱,iOS系統(tǒng)的內(nèi)核調(diào)度程序,通過跟蹤線程的執(zhí)行時間,并將其歸納為某種利用率指標或度量,然后交給DVFS機制來調(diào)度。決定負載如何計算或負載如何隨時間變化的算法,通常只需一些簡單的軟件決策即可,蘋果可以將其調(diào)整和設計到他們認為合適的方式。

由于iOS系統(tǒng)的內(nèi)核是完全封閉的,所以很難剖析iOS 12與iOS 11相比究竟改變了什么,為此AnandTech采用實際測量的方式來查看調(diào)度機制的改變,其中相對簡單的測量方法,就是跟蹤負載從空閑到峰值性能的頻率,特別是iOS 12系統(tǒng)升級前后的對比。下面開始從搭載A8芯片的iPhone 6一直測量到A12芯片iPhone XS。

首先從A8芯的iPhone 6開始,在iOS 11上測量出了很奇怪的結(jié)果,因為從空閑到滿載性能的調(diào)度行為非常不尋常,重復了幾次結(jié)果還是一樣。A8 CPU空閑時為400MHz,并在此頻率停留了110ms,接著躍至600MHz,然后經(jīng)過10ms再次提升到1400MHz的峰值頻率。不過,在iOS 12系統(tǒng)上調(diào)度行為呈現(xiàn)一種更為階梯的形式,更早提前升頻,并且在90ms后達到峰值性能。

 

 

iPhone 6S在iOS 11上的調(diào)度行為與iPhone 6明顯不同,A9芯片的DVFS調(diào)度機制升頻非常慢。CPU過了435ms才達到其最大頻率。不過,隨著iOS 12的更新,生頻到峰值頻率的時間已經(jīng)被大幅削減到了80ms,大大提高了短時交互下的性能。

 

 

iPhone 7系的A10調(diào)度在iOS 11上與A9有相似的缺點,充分發(fā)揮峰值性能的時間需超過400ms。不過在iOS 12系統(tǒng)中,iPhone 7將這個時間減半,約為210ms??雌饋鞟10與A9相比更為保守,但這可能與小內(nèi)核有關。畢竟看圖不難發(fā)現(xiàn),Zephyr小核心頻率最高峰值是1100MHz,而曲線圖頻率突然下降到758MHz,是因為此時小核心換到大核心,才會繼續(xù)升頻率,最后才是大核心的峰值性能。

 

 

在iPhone 8系和X的A11調(diào)度機制上,iOS 11與iOS 12沒有太大的變化,兩個版本系統(tǒng)A11都能在105ms的范圍內(nèi)升至全頻。請注意,在A11之后,蘋果A系芯片迅速升到峰值頻率的時間比之前幾代都要短得多了。

 

 

最后是iPhone XS系的A12芯片,必然無法測量更新前的變化,因為出廠預裝iOS 12系統(tǒng)。不過可以看到,只需108ms的時間A12就能達到了峰值性能,從Tempest小核心轉(zhuǎn)移到Vortex大核心的時間也極短。

 

 

AnandTech測完調(diào)度機制之后表示,iOS 12在舊款iPhone上的性能調(diào)度與iOS存在明顯差異,至少測量就能非常直觀地發(fā)現(xiàn)CPU升頻曲線的變化。對于iPhone XS,日用性能上絕對沒有任何問題,速度已足夠快。AnandTech還提到,他們?nèi)粘J褂玫氖茿ndroid手機,而且會完全關閉動畫效果,因為他們認為不關會影響設備的速度,或者或嚴重掩蓋設備的真實性能。然而,雖然iOS沒有辦法完全關閉動畫,但是iPhone XS依然能快速運行,毫無顧慮。

GPU性能測試

GPU的性能提升是A12的最大亮點之一,按照蘋果的說法,相比A11的GPU性能提高了50%。AnandTech表示,蘋果只是“簡單”額外添加了1個GPU核心(A11有3個核心),并在GPU中引入無損內(nèi)存壓縮技術,就能實現(xiàn)了性能大提升。其中,內(nèi)存壓縮技術被AnandTech認為是現(xiàn)最助于提高GPU微架構性能的因素,聲稱引入內(nèi)存壓縮絕對是一次巨大的轉(zhuǎn)變,但不可否認,蘋果花了很長時間才實現(xiàn)這點。

在進行性能測試之前,AnandTech稱他們最大的疑問是A12最新GPU的峰值性能和峰值功耗如何。因為之前蘋果長期都會執(zhí)行一些所謂“騷操作”,也就是在運行一段時間后,持續(xù)性能直接變?yōu)樾阅芟陆怠?/p>

首先跑3DMark Sling 3.1物理測試,既考察CPU更強調(diào)GPU使用時的平臺整體功耗極限。在這一測試中,A12相比A11有很大的進步,過去這項測試對蘋果A系芯片都不太理想,但是A12整體能效提升,性能也得到了一定提高,因此終于可以匹敵ARM陣營了。

 

 

再者是 3DMark針對GPU圖形性能的測試部分,iPhone XS相比去年的iPhone X的持續(xù)性能提升了41%。

 

 

GFXBench測試

最近Kishonti發(fā)布了最新GFXBench 5 Aztec Ruins測試工具,因此AnandTech將此測試套件作為選擇,新套件針更現(xiàn)代、更新,測試更復雜,同時新增的Aztec場景測試提供了更加復雜的效果,更強調(diào)GPU的運算性能,包括填充率、紋理、著色器效果和帶寬性能等。GFXBench 5測試子項大概如下:

 

 

普通模式下的Aztec Ruins場景是一個要求不那么高的新測試場景,所以蘋果A12芯片充分展示了其極高的峰值性能。在Aztec Ruins場景普通模式中,A12相比去年的A11提升了51%。不過,就持續(xù)性能表現(xiàn)而言,峰值性能在幾分鐘后就迅速下降了,并逐步穩(wěn)定下來,不過在持續(xù)性能方面,iPhone XS的性能相比iPhone X仍提升了61%。并且A12也能夠在持續(xù)性能表現(xiàn)上以45%的優(yōu)勢擊敗Android陣營的旗艦芯片高通驍龍845。

 

 

高級模式下的Aztec Ruins場景要求就高得多,而且更復雜。不過,這份性能排名中A12的性能依然驚人,iPhone XS的峰值性能仍非常出色,而且持續(xù)性能的跑分也不低。在Aztec Ruins場景高級模式下,iPhone XS持續(xù)性能同樣比iPhone X提升了61%,而領先驍龍845的性能差縮減到了31%,相比普通模式略低了一些,可能在某些方面碰到瓶頸,但依然最強。

 

 

在 Manhattan 3.1場景中,iPhone XS的GPU性能相比iPhone X提升巨大,達到75%。AnandTech表示,A12取得這樣的成績不僅是因為GPU微架構的改進,還要加上1個額外的核心,以及全新的工藝節(jié)點,但重點還要歸功于新的內(nèi)存壓縮技術。

 

 

最后是T-Rex場景,A12再次展示了GPU性能的巨大提升。在T-Rex場景中,iPhone XS持續(xù)性能相比iPhone X提升了61%,并且傲視群雄。

 

 

GPU功耗

由于新的Aztec Ruins場景很多設備還有相關數(shù)據(jù),所以這一次依然依賴于Manhattan 3.1場景和T-Rex場景測得的數(shù)據(jù)。A12的GPU由于引入了內(nèi)存壓縮技術,進一步降低了外部DRAM的功耗,相當于在高帶寬3D圖形負載下減少了20%-30%的功耗,而節(jié)省下來的功耗同樣可以轉(zhuǎn)換為更高的性能。

GFXBench Manhattan 3.1場景下測試的功耗,下面數(shù)字顯示的是設備整機功耗減去空閑功耗(包括屏幕功耗),在設備保持22度以下的溫度時,峰值狀態(tài)下A12的GPU非常耗電,平均功率達到了近6W,不過這仍不是GPU最高功耗,前面3DMark測試中(崩潰前)曾經(jīng)達到7.5W左右。

AnandTech表示,即便A12的GPU平均功耗不低,但其效率仍超過了所有SoC芯片,每瓦功率能夠提供的幀率達到前所未有的水平。不過,蘋果依然有所謂“騷操作”,僅3分鐘或者進行三次測試之后,GPU性能就會因為節(jié)流降頻下降25%。所以在下面的功耗表中,提供了“Warm”發(fā)熱狀態(tài)下的平均功耗,具體為3.79W,但可以看出其每瓦能夠提供的性能仍然超過了所有SoC。

 

 

在T-Rex場景測得功耗數(shù)據(jù)與上面在Manhattan 3.1場景下看到的情況差不多,保持設備涼快也就是22度以下的溫度時,A12的GPU峰值平均功率達到6W多一點。而在在運行3次之后,發(fā)熱的設備再次將功率降低到4W以下。雖然性能也下降了28%,但每瓦性能依然出色。

 

 

測完功耗之后AnandTech表示,A12發(fā)熱時的功耗并不是是持續(xù)性能時的功耗,大多數(shù)設備的在持續(xù)性能發(fā)揮時,功耗一般都控制在3W-3.5W的范圍內(nèi)。A12的GPU峰值性能和持續(xù)性能存在那么明顯的差異,與蘋果為GPU設計的日常應對的場景,以及蘋果針對A12的3D圖形處理如何調(diào)度GPU負載有關。

蘋果針對A12的GPU設計了大量使用場景,例如在大多數(shù)應用中都會使用到GPU硬件加速進行相機圖像處理,在這種用例中,GPU的持續(xù)性能并不重要,因為只是短暫的負載工作,很快就處理完畢。對于節(jié)流降頻,AnandTech認為蘋果需要做一些優(yōu)化,畢竟在使用iPhone XS玩游戲過程中不會喜歡發(fā)熱,應該通過某種必要的方式,來保證對持續(xù)性能有需求的游戲或應用也能充分利用更高的持續(xù)性能。

最后,AnandTech表示,其實除了發(fā)熱不久后降頻,以及無法持續(xù)太久峰值性能之外,蘋果最新的A12的GPU依然展示了行業(yè)最領先的性能和能效,至少可以說iPhone XS和XS Max目前是全球最好的游戲移動設備。

續(xù)航水平

測完了A12,可能大家還想看看A12設備的電池續(xù)航水平,AnandTech也對此進行了測試。iPhone XS配備了2658 mAh/10.13Wh電池,iPhone XS MAX的容量則為3174 mAh/12.08Wh。可以看出,盡管這兩款手機都是大尺寸形狀的設備,但在同尺寸設備的競爭中,蘋果為它門配備的電池容量仍落后于競爭對手。

不可否認,屏幕最大的iPhone XS Max配備的電池已經(jīng)是iPhone有史以來容量最大的一塊,但與其他手機廠商在同一規(guī)格下使用的3500 - 4000mAh相比,仍然相形見絀。正如前面在A12的SPEC測試中AnandTech所說的那樣,蘋果的SoC優(yōu)勢之一就是在能效方面遙遙領先,所以這很大程度上彌補了電池容量不足的缺口。

AnandTech測試續(xù)航的方面就是直接在WiFi下進行web網(wǎng)頁瀏覽測試,不過設定的是一種從混合到繁重的負載測試,讓設備瀏覽多遍他們在服務器上托管的一組網(wǎng)頁。測試中,針對一個web頁面會執(zhí)行加載、暫停、滾動、暫停等操作,然后再繼續(xù)到另一個網(wǎng)頁,當完成一組頁面測試后再重復所有操作,測試中屏幕亮度是固定在200 cd/m²。

 

 

在測試中,iPhone XS的續(xù)航時間與iPhone X相比略有下降,減少了19分鐘。盡管這19分鐘并不是天大的差距,但令人疑惑的問題還是來了:蘋果無論在發(fā)布會上承諾iPhone XS續(xù)航相比iPhone X有所改善,尤其使用時間iPhone XS比iPhone X最長增加30分鐘,可為何沒有得到體現(xiàn)?不過,查看蘋果官方頁面上網(wǎng)頁瀏覽續(xù)航,兩者確實同為12小時,這里AnandTech的測試要復雜和嚴苛一些,所以續(xù)航縮減到了10小時內(nèi),只是20分鐘的差距真的有點明顯了。

 

 

iPhone XS Max的續(xù)航測試最后的結(jié)果是10小時3分鐘。雖然這樣的成績不錯了,但卻比iPhone 8 Plus的11.83小時下降明顯。當然了,這里的差異合理化會更容易解釋一些,盡管AnandTech測試的網(wǎng)頁是多樣性的,很多暗色或深色頁面,但不管怎樣,XS Max采用的OLED屏幕在瀏覽白背景頁面時必然更耗電,而且機子屏幕面積也比iPhone 8 Plus更大,所以增加的電池容量不足以抵消面板耗電的增加。

AnandTech比較糾結(jié)為什么iPhone XS相比iPhone X續(xù)航時間下降了20分鐘。為了進一步證實,他們還給iPhone X升級了iOS 12重新測試,確保測試條件統(tǒng)一而不影響結(jié)果。有趣的是,升級iOS 12之后iPhone X得到的成績比1月份測試時還少了10分鐘,不過這10分鐘的差異可以忽略不計,可以肯定iOS版本不是影響續(xù)航的主要因素。

AnandTech稱他們在對A12測試時已經(jīng)明確,該芯片在工作負載方面缺少更高效了,即使帶來了更高的性能,這也應該是相對安全的耗電水平。不過,峰值和空閑之外各個階段的性能耗電量無法知曉,也就無法驗證是否是中等性能狀態(tài)下功耗更大,畢竟中等性能也是CPU執(zhí)行大量運算階段。

另外,AnandTech還進行了另一種假設,認為非常有可能是連接性因素所致,雖然不清楚全新來自博通的Broadcom BCM4377 WiFi組合芯片能效如何,但關鍵是iPhone XS使用的不再是高通基帶,反而是來自英特爾的XMM 7560基帶,這可能是影響續(xù)航的關鍵因素之一。

為什么這么說呢?AnandTech解釋稱,幾年前,由于移動運營商的基帶基站沒有啟用CDRX,所以遇到了一些嚴重的配置錯誤問題,因此他們基本上放棄了LTE續(xù)航測試,畢竟這導致測試華為設備時續(xù)航下降了近20-30%。事實上,手機續(xù)航測試比想象中要困難得多,如果沒有受控的環(huán)境,就不要輕易執(zhí)行這項測試。

總的來說,iPhone XS和XS Max電池續(xù)航水平還是是不錯的,只是并沒有達到蘋果所宣傳的改進,但這其中涉及的不確定性太多了。

小結(jié)

最后在評測的小結(jié)階段,AnandTech表示,蘋果A12芯片是SoC中的怪獸。盡管A11已經(jīng)在性能和能效方面擊敗了競爭對手,但A12在這方面卻加倍努力,這要歸功于蘋果世界級的設計團隊,他們能夠從CPU微架構中擠出更多的提升空間。

A12 Vortex CPU的內(nèi)存子系統(tǒng)獲得了巨大的提升,這使得A12在很多工作負載下獲得了顯著的性能提升。蘋果的營銷部門實際上低估了CPU方面的改進,只報了15%提升。AnandTech估計,A12的CPU在很多負載測試下的性能會提高40%左右,在某些情況下甚至會有更大的提升。蘋果的CPU現(xiàn)在已經(jīng)有了非常高的性能,所以更期待未來幾年的會如何發(fā)展,以及這對于蘋果的非移動產(chǎn)品將意味著什么。

在GPU方面,蘋果官宣的提升確實在承諾的數(shù)字之內(nèi),但在持續(xù)性能表現(xiàn)方面超過了承諾的數(shù)字。新GPU看似去年的迭代升級,但是添加了第四個核心,并新增了無損內(nèi)存壓縮技術,這一重要的改進將GPU性能提升到了新的水平。GPU方面AnandTech認為蘋果真的要改進節(jié)流降頻機制,不是完全不節(jié)流,而是應該更少節(jié)流,因為直接開放性能上限會非常耗電,并且在游戲的最初幾分鐘就會給手機帶來很大的發(fā)熱量。

 

 

在電池續(xù)航方面,iPhone XS在網(wǎng)頁瀏覽測試中相比iPhone X并沒有提升,在一定程度上令人驚訝。這不確定這是否與A12某種隱性的低能效有關,或者可能與新的WiFi芯片或蜂窩調(diào)制解調(diào)器有關。對于英特爾基帶,AnandTech稱他們將會花些時間討論這個話題,并重新驗證續(xù)航時間。

對于iPhone XS Max,電池續(xù)航時間低于iPhone 8 Plus其實不足為奇,畢竟OLED屏幕的能效低于去年iPhone配備的LCD顯示屏,而電池容量的增加并不足以抵消這一點。對于那些認為iPhone XS Max大尺寸大電池續(xù)航就更好的用戶而言,這是需要注意的地方??傊?,綜合來看,iPhone XS和XS Max是蘋果迄今為止發(fā)布過的最好的手機。

這樣的A12處理器是不是讓你心動了呢?不知道華為麒麟980能達到一個什么樣的高度,華為Mate 20即將發(fā)布,華為能否用自家的黑科技繼續(xù)保持第二甚至躍居第一呢,讓我們拭目以待!

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉