蘋果A12處理器：低功耗小核心集群和NPU集群解密

時(shí)間：2018-10-18 10:32:01

關(guān)鍵字： apple蘋果 a12處理器蘋果a12處理器

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]上周我們對(duì)全新iPhone XS和A12處理器進(jìn)行了深入分析，不過(guò)主要部分集中在CPU的大核心集群以及GPU集群兩方面，對(duì)A12的低功耗小核心集群和NPU集群并沒(méi)有過(guò)多描述，本文便來(lái)繼續(xù)探究這兩部分。

上周我們對(duì)全新iPhone XS和A12處理器進(jìn)行了深入分析，不過(guò)主要部分集中在CPU的大核心集群以及GPU集群兩方面，對(duì)A12的低功耗小核心集群和NPU集群并沒(méi)有過(guò)多描述，本文便來(lái)繼續(xù)探究這兩部分。

與大核心Vortex非常相似，A12的Tempest核心的最大改進(jìn)體現(xiàn)在對(duì)內(nèi)存敏感的測(cè)試項(xiàng)中。，而輸給A11的Mistral核心主要是由于頻率劣勢(shì)?？傮w而言，除了內(nèi)存改進(jìn)之外，Tempest核心在性能上與Mistral核心非常相似，這也為我們對(duì)比二者的能耗比提供了便利。

但不幸的是，Tempest核心相比Mistral核心的能耗比提升并不如大核心一樣巨大，縱觀SPECint2006測(cè)試，Tempest核心的能耗比提升了35%，考慮到Mistral核心的頻率更高，實(shí)際同頻下的能耗比提升還要低于35%。而在浮點(diǎn)基準(zhǔn)測(cè)試中，Tempest核心的能耗比平均只提高了17％。

如果將A11和A12的小核心與大核心以及來(lái)自Arm的競(jìng)爭(zhēng)對(duì)手放在一起對(duì)比，其實(shí)并沒(méi)有太大的驚喜。與蘋果的大核心相比，小核心的性能大概只有三分之一到四分之一，但它們消耗的能量卻足有大核心的一半。

（小核心的功耗只有大核心的七分之一到八分之一，但因?yàn)樾阅茌^低，執(zhí)行相同任務(wù)所用的時(shí)間更長(zhǎng)，因此實(shí)際消耗的能量為大核心的一半）

不過(guò)令人驚訝的是，在SPEC的整數(shù)工作負(fù)載中，A12的Tempest核心和A11的Mistral核心性能甚至相當(dāng)于2.1GHz頻率下的Cortex A73，但Mistral核心的功耗卻僅有Cortex A73的41%（A11和麒麟970同為臺(tái)積電10nm）。不過(guò)在浮點(diǎn)工作負(fù)載中，小核心由于沒(méi)有專用的浮點(diǎn)執(zhí)行單元而失去了性能上的競(jìng)爭(zhēng)力，但它們?nèi)阅芴峁┖芨叩哪苄А?/p>

從測(cè)試來(lái)看，蘋果的小核心要比Arm的小核心性能要高得多，從私下里積累的Cortex A55測(cè)試成績(jī)來(lái)看，Tempest核心的性能大概是Cortex A55的將近3倍。Arm小核心的性能在實(shí)際使用中很容易成為短板，這意味著我們未來(lái)可能會(huì)看到更多像麒麟980這樣的的“大-中-小”三集群SoC，而Arm也應(yīng)該思考一下小核心是否還應(yīng)該繼續(xù)使用性能低下的順序執(zhí)行架構(gòu)。

NPU神經(jīng)網(wǎng)絡(luò)推理性能測(cè)試

A12另一個(gè)重大而神秘的進(jìn)化是自主研發(fā)的全新NPU，????NPU在A12芯片上占據(jù)了較大的面積，幾乎相當(dāng)于兩顆Vortex大核心。

幸運(yùn)的是，魯大師的AImark支持iOS，使用Apple的CoreML框架來(lái)加速與Android相同的推理模型，可以直接對(duì)比蘋果和安卓陣營(yíng)處理器的神經(jīng)網(wǎng)絡(luò)推理性能。

從結(jié)果來(lái)看，雖然蘋果公布的理論性能（A11：0.6TOps，A12：5 TOps）在這個(gè)測(cè)試中并未得到很好的驗(yàn)證，但提升依然達(dá)到了4~6.5倍。測(cè)試中還發(fā)現(xiàn)，擁有NPU的A11成績(jī)并沒(méi)有比A10高出許多，這可能是由于A11的NPU從未通過(guò)API公開(kāi)展示，因此在測(cè)試中只能使用GPU來(lái)執(zhí)行CoreML。

華為P20 Pro的麒麟970比A12落后大約2.5倍，恰好與各自宣稱的NPU理論性能比例相同（2TOP和5TOP）。而華為表示，麒麟980的全新雙核NPU比麒麟970的NPU快2.2倍，每分鐘可實(shí)現(xiàn)4500次推斷，由此看來(lái)麒麟980的AI性能應(yīng)該能夠追平A12。

高通驍龍845的表現(xiàn)也很好，在不同特性的測(cè)試中與麒麟970互有勝負(fù)。由于AJmark目前還不支持NNAPI，只能使用SNPE框架進(jìn)行推理加速，因此Pixel 2和Note9不得不使用CPU來(lái)進(jìn)行運(yùn)算，測(cè)試結(jié)果很差。

功耗方面，A12的NPU滿載功耗約為5.5瓦，且整個(gè)測(cè)試期間的功耗有很大起伏。這一功耗水平意味著蘋果希望擁有最高的突發(fā)處理性能。使用GPU加速AI處理的A11和10功耗在2.3瓦到5瓦范圍內(nèi)，具體取決于推理模型。