今年,知名硬件網(wǎng)站anandtech發(fā)布了對(duì)蘋果iPhone 11系列和蘋果A13芯片深入解讀。在芯片環(huán)節(jié),他們通過對(duì)蘋果這顆芯片的深入分析。并得出一個(gè)結(jié)論:與所有的安卓系芯片相比,蘋果A13擁有最佳的性能表現(xiàn)。首先在制造工藝方面,根據(jù)anandtech的分析,蘋果A13使用的是N7節(jié)點(diǎn)的性能調(diào)整型工藝,而不是基于EUV生產(chǎn)的N7 +節(jié)點(diǎn)。他們進(jìn)一步指出,他們這邊還沒披露這顆芯片的具體尺寸,但從TechInsights的數(shù)據(jù)顯示,蘋果新芯片的尺寸為98.48mm2,比去年的A12大18.3%。而在內(nèi)核性能方面,anandtech表示,A13同樣采用“2+4”的設(shè)計(jì),其大型性能內(nèi)核的時(shí)鐘速度與前一代相比,大約提高了6%,使其達(dá)到2666MHz左右。但根據(jù)去年的經(jīng)年,當(dāng)時(shí)A12大內(nèi)核的時(shí)鐘頻率約為2500MHz,但在性能計(jì)數(shù)器測(cè)得的準(zhǔn)確數(shù)字似乎是2514MHz。同樣,A13的大核心時(shí)鐘應(yīng)比其估計(jì)的2666MHz時(shí)鐘高幾個(gè)MHz。小型效率內(nèi)核的時(shí)鐘頻率提高了8.8 – 12.3%,使其最高頻率達(dá)到了約1728MHz。這是一個(gè)很好的提升,但是重要的是,當(dāng)有更多的小核處于活動(dòng)狀態(tài)時(shí),它們現(xiàn)在不會(huì)降低時(shí)鐘頻率。anandtech進(jìn)一步指出,這一代的大型內(nèi)核稱為“Lightning”,是去年Vortex微體系結(jié)構(gòu)的直接后繼產(chǎn)品。在他們看來,新的內(nèi)核在核心設(shè)計(jì)方面,至少在通常的執(zhí)行單元方面,與去年的核心之間沒有太大差異。微體系結(jié)構(gòu)的核心仍然是7寬(wide)的解碼前端,與非常寬的執(zhí)行后端配對(duì),該后端具有6個(gè)ALU和3個(gè)FP /矢量流水線。因?yàn)長(zhǎng)ightning和Vortex兩者在很大程度上相似,所以anandtech認(rèn)為Apple尚未對(duì)執(zhí)行后端進(jìn)行任何實(shí)質(zhì)性更改,但值得注意的是其復(fù)雜的整數(shù)管道,在這上面確實(shí)看到了改進(jìn)。在這里,兩個(gè)乘法器單元可以減少一個(gè)周期的延遲,從4個(gè)周期減少到3個(gè)周期。整數(shù)吞吐量也得到了很大的提升,因?yàn)橥掏铝楷F(xiàn)在已經(jīng)加倍,并且延遲/最小周期數(shù)從8個(gè)減少到8個(gè)。 7個(gè)周期。在緩存方面,蘋果似乎保留了A12的Vortex內(nèi)核中的緩存結(jié)構(gòu)。這意味著我們具有8路關(guān)聯(lián)的128KB L1指令和數(shù)據(jù)緩存。數(shù)據(jù)高速緩存保持非常快的速度,并具有3個(gè)周期的加載使用延遲。內(nèi)核之間共享的L2高速緩存繼續(xù)保持8MB的大小,但是Apple已將延遲從16個(gè)周期減少到14個(gè)周期,在發(fā)布會(huì)的時(shí)候,我們記得蘋果介紹芯片的時(shí)候提到,CPU內(nèi)核的一個(gè)重大變化是Apple將“機(jī)器學(xué)習(xí)加速器”集成到微體系結(jié)構(gòu)中。從本質(zhì)上講,它們似乎是矩陣乘法單元,并帶有類似DSP的指令,Apple將其性能提高到了1太字節(jié)操作(TOP)吞吐量,聲稱比常規(guī)矢量流水線提高了6倍。根據(jù)anandtech的分析,該AMX指令集似乎是在CPU內(nèi)核上運(yùn)行的ARM ISA的超集。關(guān)于這意味著什么一直有很多困惑,因?yàn)橹钡浆F(xiàn)在還不廣為人知,允許Arm體系結(jié)構(gòu)的被許可人使用自定義指令擴(kuò)展其ISA。我們無法從Apple或Arm那里得到任何確認(rèn),但是,很明顯的一件事是Apple并未向開發(fā)人員公開公開這些新指令,并且它們也未包含在Apple的公共編譯器中。但是,我們確實(shí)知道,Apple內(nèi)部確實(shí)有可用的編譯器,并且Acclerate.framework之類的庫似乎能夠利用AMX。rm最近透露了將定制指令提供給供應(yīng)商以實(shí)施和集成到Arm內(nèi)核中的證據(jù),這顯然足以證明體系結(jié)構(gòu)被許可人可以自由地做自己想做的事情–蘋果選擇隱藏AMX指令至少可以解決對(duì)可能的ISA的擔(dān)憂軟件方面的碎片化。蘋果公司的小型效率內(nèi)核非常有趣,因?yàn)榕cArm的典型小型內(nèi)核(例如Cortex-A55)相比,它們并沒有那么小。去年,A12中的Tempest效率核心基于一個(gè)3幅亂序的微體系結(jié)構(gòu),該體系結(jié)構(gòu)具有兩個(gè)主要執(zhí)行管道,與L / S單元一起工作,我們假設(shè)這是一個(gè)專用的單元。今年的Thunder微體系結(jié)構(gòu)似乎對(duì)效率CPU內(nèi)核進(jìn)行了重大更改,因?yàn)槲覀兛吹搅诵聝?nèi)核的執(zhí)行功能的實(shí)質(zhì)性升級(jí)。就整數(shù)ALU而言,我們似乎仍在查看兩個(gè)單元,但是Apple已將能夠進(jìn)行標(biāo)志設(shè)置操作的單元數(shù)量從1倍增加到2倍。MUL吞吐量在每個(gè)周期保持1條指令,而除法單元也是貌似不變。從新的A13 Thunder內(nèi)核的性能來看,我們看到新的微體系結(jié)構(gòu)已大大提高了IPC,SPECint的增益從403.gcc的19%提高到400.perlbench的38%,而浮點(diǎn)性能在非內(nèi)存綁定的SPECfp工作負(fù)載中,性能也同樣提高了34-38%。在其他方面,我們看到一些性能下降,這是因?yàn)锳pple更改了內(nèi)存子系統(tǒng)的DVFS策略,導(dǎo)致效率核心無法觸發(fā)某些內(nèi)存控制器的更高頻率性能狀態(tài)。這導(dǎo)致我們看到一些奇怪的結(jié)果,例如470.lbm。新內(nèi)核的電源效率也明顯更高。當(dāng)然,其中一些改進(jìn)將歸因于系統(tǒng)內(nèi)存運(yùn)行速度不快,但考慮到內(nèi)核仍可在SPEC套件中提供10%到23%的平均性能,仍然給人留下深刻的印象,即能耗降低了25%平均而言,也指向主要的效率提升。面對(duì)Lightning核心(除AMX之外)相對(duì)保守的變化,新的Thunder核心對(duì)于A13來說似乎是徹底的巨大變化,并且與Apple過去的效率核心微體系結(jié)構(gòu)存在重大分歧。在與諸如Snapdragon 855的Cortex-A55實(shí)施方案進(jìn)行對(duì)抗時(shí),新的Thunder內(nèi)核表現(xiàn)出2.5-3倍的性能領(lǐng)先優(yōu)勢(shì),而能耗卻不到一半。SPEC2006性能:臺(tái)式機(jī)水平
鑒于我們沒有看到大型Lightning CPU內(nèi)核的微體系結(jié)構(gòu)有太多重大變化,因此我們不會(huì)期望其較之A12,性能會(huì)有特別大的提高。但是,由于內(nèi)存子系統(tǒng)和核心前端的改進(jìn),時(shí)鐘頻率增加了6%,而IPC卻提高了幾個(gè)百分點(diǎn),因此可以,而且確實(shí)會(huì)帶來大約20%的性能提升,這與實(shí)際情況是一致的。蘋果在做廣告。我暫時(shí)仍要回到SPEC2006,因?yàn)槲疫€沒有時(shí)間移植和測(cè)試2017年的移動(dòng)設(shè)備。在SPECint2006中,性能的改進(jìn)相對(duì)平均地分布。平均而言,我們看到性能提高了17%。最大的收益來自受延遲限制的471.omnetpp和403.gcc,這給緩存帶來了更大的壓力。這些測(cè)試分別增加了25%和24%,這是非常顯著的。盡管性能數(shù)據(jù)非常簡(jiǎn)單明了,而且沒有任何令人驚訝的地方,但另一方面,功率和效率數(shù)據(jù)卻極其出乎意料。在幾乎所有的SPECint2006測(cè)試中,Apple都采用了A13 SoC并提高了峰值功耗。因此,在許多情況下,我們比A12高出近1W。在這里,在性能達(dá)到峰值時(shí),功率增加似乎大于性能增加,這就是為什么在幾乎所有工作負(fù)載中,A13的效率都低于A12的原因。總體而言,就性能而言,A13和Lightning內(nèi)核非???。在移動(dòng)領(lǐng)域,實(shí)際上沒有競(jìng)爭(zhēng),因?yàn)锳13的性能幾乎是次佳的非Apple SoC的兩倍。在浮點(diǎn)套件中,兩者的差異要小一些,但同樣,我們至少要再等待2-3年,才能期待任何適當(dāng)?shù)母?jìng)爭(zhēng),而且Apple也不會(huì)停滯不前。去年,我注意到A12與最好的臺(tái)式機(jī)CPU內(nèi)核相比差強(qiáng)人意。今年,A13至少在SPECint2006上與AMD和Intel所能提供的最佳匹配。在SPECfp2006中,A13仍落后約15%。令人震驚的功率數(shù)字的一種可能解釋是,對(duì)于A13,蘋果公司在新的Lightning核心的峰值頻率處處于頻率/電壓曲線的遠(yuǎn)端。在上圖中,我們估算了去年A12的功率曲線–在這里,我們可以看到Apple非常保守,其電壓直到最后幾百M(fèi)Hz。對(duì)于A13而言,蘋果在隨后的頻率狀態(tài)下可能更激進(jìn)。關(guān)于這種假設(shè)的好消息是,平均而言,在日常工作量中,A13應(yīng)該在效率更高的運(yùn)行點(diǎn)上運(yùn)行。蘋果公司的營(yíng)銷材料將A13的速度提高了20%,同時(shí)還指出其耗電量比A12少30%,不幸的是,這種說法具有欺騙性(或至少不清楚)。盡管我們懷疑很多人會(huì)把它解釋為意味著A13速度提高了20%,而同時(shí)使用的功率卻減少了30%,但這實(shí)際上是其中之一。實(shí)際上,這意味著在相當(dāng)于A12峰值性能的性能點(diǎn)上,A13的能耗將減少30%??紤]到蘋果功率曲線的陡峭性,我可以輕易地想象出這是準(zhǔn)確的。在研究了新A13的CPU性能之后,是時(shí)候看看它在某些系統(tǒng)級(jí)測(cè)試中的性能了。不幸的是,仍然缺少針對(duì)iOS的適當(dāng)?shù)南到y(tǒng)測(cè)試,這尤其令人沮喪,尤其是涉及PCMark之類的測(cè)試時(shí),它們可以更準(zhǔn)確地表示應(yīng)用程序用例。取而代之的是,我們必須退回到基于瀏覽器的基準(zhǔn)測(cè)試。瀏覽器性能仍然是設(shè)備性能的一個(gè)重要方面,因?yàn)樗匀皇侵饕ぷ髫?fù)載之一,它在顯示性能延遲(例如響應(yīng)時(shí)間)等性能特征時(shí),給CPU帶來了很大壓力。與往常一樣,以下基準(zhǔn)測(cè)試不僅表示硬件功能,還表示手機(jī)的軟件優(yōu)化。在我們的測(cè)試中,iOS13再次將基于瀏覽器的基準(zhǔn)性能提高了約10%。我們已經(jīng)進(jìn)行了更新,并以iOS13上的新分?jǐn)?shù)更新了上一代iPhone的性能數(shù)據(jù),以對(duì)新iPhone 11進(jìn)行正確的Apple-Apple比較。在Speedometer 2.0中,我們看到新的基于A13的手機(jī)與上一代iPhone XS和A12相比,性能提高了19-20%。這一增長(zhǎng)與蘋果的性能要求保持一致。今年的增長(zhǎng)比我們?nèi)ツ晔褂肁12看到的要小,因?yàn)槿ツ甑梅值闹饕嵘坪跏巧?jí)到128KB L1I緩存。與A12相比,A13在達(dá)到大型Lightning內(nèi)核的最大時(shí)鐘速度所需的時(shí)間方面并沒有太大變化,而CPU內(nèi)核在超過100ms的時(shí)間內(nèi)達(dá)到了峰值。真正改變的是工作負(fù)載駐留在較小的Thunder效率內(nèi)核上的時(shí)間。在A13上,小核心的爬坡速度比在A12上要快得多。調(diào)度程序行為以及工作負(fù)載從小型內(nèi)核遷移到大型內(nèi)核時(shí),也都發(fā)生了重大變化?,F(xiàn)在,在A13上,這種情況大約在30毫秒后發(fā)生,而在A12上,這可能需要54毫秒。由于小型內(nèi)核不再能夠獨(dú)自請(qǐng)求更高的內(nèi)存控制器性能狀態(tài),因此在工作負(fù)載要求更高的情況下,現(xiàn)在應(yīng)該盡快遷移到大型內(nèi)核。A13的Lightning內(nèi)核以910MHz左右的基本頻率啟動(dòng),這比A12及其1180MHz的基本頻率低了一點(diǎn)。這意味著Apple已將A13中大型內(nèi)核的動(dòng)態(tài)范圍擴(kuò)展到了更高的性能以及更低,更有效的頻率。蘋果還聲稱已經(jīng)提高了A13中神經(jīng)處理器IP模塊的性能。要使用此單元,您必須使用CoreML框架。不幸的是,到目前為止,我們還沒有一個(gè)自定義工具來測(cè)試它,因此我們不得不依靠一種罕見的外部應(yīng)用程序?yàn)樗峁┗鶞?zhǔn),那就是魯大師的AIMark。像網(wǎng)絡(luò)瀏覽器的工作負(fù)載一樣,iOS13也為過去的設(shè)備帶來了性能改進(jìn),因此我們重新運(yùn)行了iPhone X和XS評(píng)分,以便與新iPhone 11進(jìn)行適當(dāng)比較。iPhone 11和新款A(yù)13的改進(jìn)取決于型號(hào)和工作負(fù)載。對(duì)于InceptionV3和ResNet34等經(jīng)典模型,我們發(fā)現(xiàn)推理率提高了23-29%。MobileNet-SSD的增長(zhǎng)幅度有限,僅為17%,而DeepLabV3的增長(zhǎng)幅度則為48%。通常,運(yùn)行機(jī)器學(xué)習(xí)基準(zhǔn)測(cè)試的問題是它貫穿抽象層(在本例中為CoreML)運(yùn)行。我們無法保證NPU與CPU和GPU上實(shí)際運(yùn)行了多少模型,因?yàn)楦鶕?jù)設(shè)備的ML驅(qū)動(dòng)程序,它們之間可能會(huì)有很大差異。不過,這里的A13和iPhone 11很有競(jìng)爭(zhēng)力,并且為這一代人提供了良好的迭代性能。總體而言,iPhone 11s的性能非常出色,因?yàn)槲覀円呀?jīng)一次又一次地期望蘋果公司。話雖如此,我不能說我在日常使用中與iPhone XS的區(qū)別太大。因此,盡管A13提供了一流的性能,但對(duì)于來自去年A12設(shè)備的用戶而言,它可能不會(huì)非常引人注目。老式設(shè)備將帶來更大的影響。否則,憑借如此強(qiáng)大的功能,我覺得用戶體驗(yàn)將從加速應(yīng)用程序和系統(tǒng)動(dòng)畫的選項(xiàng)中受益匪淺,或者甚至完全關(guān)閉它們以真正感受到硬件的順暢性。我們?cè)敿?xì)介紹了A13的CPU,GPU也是不可忽視的一部分。蘋果今年在對(duì)這個(gè)單元的性能表現(xiàn)更為保守,該公司承諾,在與A12相同的性能下,GPU性能提高20%或功率降低40%。除了芯片組和GPU的原始性能外,游戲的重要意義在于實(shí)際設(shè)備的熱特性以及如何消散和維持SoC的高熱量。對(duì)于A12,我確實(shí)批評(píng)蘋果,因?yàn)樗谠试S手機(jī)開始使用3D工作負(fù)載的峰值功率方面表現(xiàn)得非常激進(jìn)。這導(dǎo)致電話在降低速度之前并不能真正保持這些性能水平超過2-3分鐘。今年,蘋果公司已經(jīng)宣布,他們已經(jīng)提高了設(shè)備的SoC冷卻能力,能夠更好地將熱量從SoC散布到手機(jī)主體,從而使芯片保持更高的性能狀態(tài)。從3DMark中的物理測(cè)試開始,實(shí)際上,在GPU工作負(fù)載期間受功率限制時(shí),這實(shí)際上更多地是CPU工作負(fù)載。在這種情況下,與去年的iPhone相比,iPhone 11在峰值性能方面的表現(xiàn)要好一些,但是它們并不能完全保持與A12 iPhone相同的持續(xù)性能。切換到對(duì)GPU施加最大壓力的圖形工作負(fù)載,我們現(xiàn)在在這里看到分?jǐn)?shù)和排名的重大變化。首先,與去年的A12設(shè)備相比,新的iPhone 11s和A13現(xiàn)在顯示出顯著的性能提升。我注意到,當(dāng)我們分析該芯片時(shí),蘋果在3DMark方面表現(xiàn)異常差強(qiáng)人意,并且看來蘋果能夠解決這一代的任何瓶頸,性能提高了38%。實(shí)際上,我已經(jīng)回過頭來,迅速對(duì)iOS13上的iPhone XS進(jìn)行了測(cè)試,與我們?cè)诖藞D中看到的相比,確實(shí)看到了20%的性能提升。新的iPhone得分不及某些Snapdragon 855(+)設(shè)備,但這是因?yàn)锳pple不允許iPhone的發(fā)熱量幾乎與其他某些設(shè)備一樣高。我無法在任何新iPhone上測(cè)量高于41°C的場(chǎng)景。通過測(cè)量功耗,我們?cè)俅慰吹紸13設(shè)備的峰值功率極激進(jìn),超過6.2W。有趣的是,即使在這種耗電的峰值性能狀態(tài)下,A13的效率也比A12高,并且比競(jìng)爭(zhēng)對(duì)手的效率高得多。通過一系列的測(cè)試,anandteh指出,去年,A13的GPU性能是同類產(chǎn)品中最佳。他們表示,去年A12在GPU方面進(jìn)行了令人印象深刻的改進(jìn),這是蘋果第一次在性能和效率方面能夠非常明顯地領(lǐng)先于高通。首先,A13的峰值性能確實(shí)提高了約20%。但是,這不是人們應(yīng)該最關(guān)注的指標(biāo)。與去年的iPhone相比,蘋果的持續(xù)性能得分提高更為顯著,達(dá)到50%至60%。看起來,蘋果聲稱改善了SoC散熱性能的說法非常好。最重要的是,蘋果在A13上的新型GPU微體系結(jié)構(gòu)令人印象深刻。鑒于流程節(jié)點(diǎn)的發(fā)展微不足道,我沒想到該公司能夠推動(dòng)如此大的性能和功率效率提升。我們需要從競(jìng)爭(zhēng)對(duì)手中看到一些重大的模式轉(zhuǎn)變,以使它們能夠趕上下一代設(shè)備。