ARM Cortex-A 移動處理器發(fā)展概覽
(作者:Song Bin 宋斌)
簡介
ARM Cortex-A移動應(yīng)用處理器產(chǎn)品線橫跨了幾代產(chǎn)品和三個主要產(chǎn)品類別。有些開發(fā)人員和SoC設(shè)計人員經(jīng)歷了一款或多款新型ARM處理器的推出過程,他們知道該產(chǎn)品線如何從單個高性能通用CPU設(shè)計演進成為三個不同產(chǎn)品線,分別面向高端、中端、入門級的移動設(shè)備SoC市場,這讓他們受益匪淺。
Cortex-A8
ARM在2005年向市場推出Cortex-A8處理器,是第一款支持armv7-a架構(gòu)的處理器。ARMv7包括3個關(guān)鍵要素:NEON單指令多數(shù)據(jù)(SIMD)單元、ARMtrustZone安全擴展、以及thumb2指令集,通過16位和32位混合長度指令以減小代碼長度。Cortex-A8是ARM實現(xiàn)的第一個基于新ISA的超標量處理器:它實現(xiàn)了完全雙發(fā)射流水線,這意味著cortex-a8能夠同時發(fā)出在指令流中先后出現(xiàn)的任何兩個沒有數(shù)據(jù)依賴的指令。但是,它不能亂序來發(fā)射或撤銷指令–該功能在之后的設(shè)計中才被實現(xiàn)。
當(dāng)我們推出Cortex-A8時,很多合作伙伴認為這款處理器放在移動電話上是大材小用,他們很自然地質(zhì)疑道,“客戶會在手機上瀏覽互聯(lián)網(wǎng)?不太可能吧。”但是,我們和業(yè)界一些主要思想領(lǐng)袖合作,向客戶將會需要的產(chǎn)品邁進,尤其是因為當(dāng)Cortex-A8在2008年投入批量生產(chǎn)時,高帶寬無線連接(3G)已經(jīng)問世,大屏幕也用于移動設(shè)備。創(chuàng)新的移動行業(yè)充分利用了該產(chǎn)品:Cortex-A8芯片的推出正好趕上了智能手機出貨量猛增的大好時機。
Cortex-A9
推出Cortex-A8之后不久,ARM又推出了首款多核ARMv7CPU:cortex-a9。Cortex-A9利用硬件模塊來管理CPU集群中一至四個核心之間的高速緩存一致性,加入了一個外部二級高速緩存。理論上,客戶可以設(shè)計不包括二級緩存的小型版本Cortex-A9,這種設(shè)計允許剔除管理高速緩存一致性的邏輯模塊,以實現(xiàn)尺寸更小的單核設(shè)計。但實際上,大多數(shù)設(shè)計都采用雙核個或更多核心并附帶二級高速緩存。此外,在2011年底和2012年初,當(dāng)移動SoC設(shè)計人員可以采用多個核心之后,提高性能的突破點從提高單核性能轉(zhuǎn)移到提高核的數(shù)量。旗艦級高端移動CPU迅速從最初的雙核拓撲結(jié)構(gòu)移至四核Cortex-A9。
除了開啟了多核性能大門之外,與Cortex-A8相比,每個Cortex-A9處理器的單時鐘周期指令吞吐量提高了大約25%。這個性能的提升是在保持相似功耗和芯片面積的前提下,通過縮短流水線并亂序執(zhí)行以及在流水線早期階段集成neonSIMD和浮點功能而實現(xiàn)的。
Cortex-A15
隨著智能手機市場開始加速發(fā)展,ARM再次預(yù)見到了不斷發(fā)展的移動系統(tǒng)對芯片性能提出的更高要求。為此ARM開發(fā)了一款性能上大幅提升的處理器,用以專門針對新的高端移動市場。在已經(jīng)非常強大的Cortex-A9的基礎(chǔ)上,ARM憑借cortex-a15又將性能提高了50%以上。此外,Cortex-A15引入了一系列架構(gòu)擴展,從而實現(xiàn)了更大物理地址空間、硬件虛擬化支持和擴展一致性。在32位系統(tǒng)中內(nèi)存被劃分為2GB設(shè)備內(nèi)存和2GB普通內(nèi)存,當(dāng)設(shè)備的RAM超出2GB的時候,擁有更大的物理地址空間就變得異常重要。ARM和其他合作伙伴也一直在探索虛擬化技術(shù)在商務(wù)移動系統(tǒng)和自帶設(shè)備中的用戶操作系統(tǒng)以及類似應(yīng)用情景進行探索。。擴展一致性在big.LITTLE處理器技術(shù)中被應(yīng)用的淋漓盡致,它提供了一種降低平均功耗并在功耗受限的條件下優(yōu)化達到最大性能的方法。
Cortex-A15集群集成了監(jiān)聽控制單元(SCU)以實現(xiàn)硬件一致性,每個集群包含一至四個CPU核心,并集成二級高速緩存控制器–Cortex-A15之后的所有ARMCortex-A系列CPU都沿用了這種拓撲結(jié)構(gòu)。
在移動設(shè)備中不斷突破性能極限
比較Cortex-A系列高端處理器的性能,可以看到自從Cortex-A81GH處理器在2008年上市以來,性能有了大幅提升。
一致性擴展機制,實現(xiàn)為AMBAACE,使下圖所示的big.littleSoC成為可能。在big.LITTLE系統(tǒng)中,通常實現(xiàn)一個“大”CPU集群,并對其進行調(diào)節(jié)以滿足高性能的要求,同時對“小”的CPU集群進行調(diào)節(jié),滿足對高能效。在典型工作負載中,LITTLE處理器可以處理絕大部分工作,而“big”CPU集群的激活時間不足10%,在很多情況下還達不到總CPU運行時間的1%。通過CoreLinkCCI-400高速緩存一致性互連組件,CPU集群能夠監(jiān)聽其他集群的高速緩存,從而實現(xiàn)軟件線程從一個集群到另一集群的快速轉(zhuǎn)移。
Cortex-A12
隨著智能手機市場的爆炸式增長,SoC供應(yīng)商和OEM將該市場劃分為旗艦高端級別、中端級別、低成本入門級別。隨著這些細分市場的出現(xiàn),ARM一直在定義專門針對上述三個級別市場的不同處理器。cortex-a12是采用全新微架構(gòu)的一個全新處理器,專門面向快速發(fā)展的中端移動市場。下圖顯示了這些細分市場的規(guī)模,以及面向這些細分市場的ARMCortex-A產(chǎn)品:
Cortex-A12的設(shè)計面向中端移動SoC,以滿足這一細分市場對于芯片面積和功耗的要求。它使用無序雙執(zhí)行流水線,其性能比當(dāng)前在許多中端移動SoC中使用的Cortex-A9高出40%。Cortex-A12在2013年中推向市場,有望在2014投入量產(chǎn)。它是一款32位處理器,具有與Cortex-A15相同的物理地址擴展和相關(guān)的架構(gòu)特性。
Cortex-A12能夠在很多(但并非全部)用例中提供接近Cortex-A15的性能。Cortex-A12還針對中端移動設(shè)計進行了優(yōu)化,取消了一些企業(yè)功能,使用略微簡單的流水線,因此在橫跨多個市場的高端設(shè)備上都可以找到Cortex-A15的身影,而Cortex-A12則專門面向中端移動設(shè)計。
Cortex-A57
cortex-a57是ARM針對2013年、2014年和2015年設(shè)計起點的CPU產(chǎn)品系列的旗艦級CPU,它采用armv8-a架構(gòu),提供64位功能,而且通過Aarch32執(zhí)行狀態(tài),保持與ARMv7架構(gòu)的完全后向兼容性。在高于4GB的內(nèi)存廣泛使用之前,64位并不是移動系統(tǒng)真正必需的,即便到那時也可以使用擴展物理尋址技術(shù)來解決,但盡早推出64位,可以實現(xiàn)更長、更順暢的軟件遷移,讓高性能應(yīng)用程序能夠充分利用更大虛擬地址范圍來運行內(nèi)容創(chuàng)建應(yīng)用程序,例如視頻編輯、照片編輯和增強現(xiàn)實。新架構(gòu)可以運行64位操作系統(tǒng),并在操作系統(tǒng)上無縫混合運行32位和64位應(yīng)用程序。ARMv8架構(gòu)可以實現(xiàn)狀態(tài)之間的輕松轉(zhuǎn)換。
除了ARMv8的架構(gòu)優(yōu)勢之外,Cortex-A57還提高了單個時鐘周期性能,比高性能的Cortex-A15CPU高出了20%至40%。它還改進了二級高速緩存的的設(shè)計以及內(nèi)存系統(tǒng)的其他組件,極大的提高了能效。Cortex-A57將為移動系統(tǒng)提供前所未有的高能效性能水平,而借助big.LITTLE,SoC能以很低的平均功耗做到這一點。
高效率產(chǎn)品線:Cortex-A5、Cortex-A7、Cortex-A53
隨著智能手機市場的崛起,最先出現(xiàn)的市場是入門級市場。在新興市場,移動設(shè)備沒有獲得無線運營商的補貼,因此用戶必須支付全價來購買移動設(shè)備,并且按月支付合約的服務(wù)費用。新興市場的價格范圍在150美元以下,并將很快降至75美元以下–我們需要一種不同類型的SoC設(shè)計來滿足這些市場的需求。在Cortex-A9發(fā)布之后不久,ARM試圖開發(fā)一款處理器來滿足這一市場需求:這款產(chǎn)品的尺寸和功耗與舊款A(yù)RM926等功能性手機處理器大致相同,但性能高于在第一代智能手機中使用的arm11系列。2009年,我們發(fā)布了Cortex-A5,該設(shè)計通過有序單執(zhí)行8級流水線實現(xiàn)了上述目標。利用這種簡單流水線設(shè)計,我們可將功耗保持在非常低的水平。而簡化的功能集,造就了ARM有史以來最高效的(每mW性能)應(yīng)用處理器。
在cortex-a5取得成功的基礎(chǔ)上ARM又設(shè)計了目前已在入門級智能手機中得到大量應(yīng)用cortex-a7處理器,形成了一個充滿活力的智能手機處理器細分市場。隨著Cortex-A5取得成功,下一個目標是開發(fā)能夠匹配Cortex-A15的架構(gòu)功能集的類似處理器,從而在big.LITTLE配對中將其與Cortex-A15結(jié)合使用。同時,該款處理器還應(yīng)該在Cortex-A5的基礎(chǔ)上提升性能,并具有與之相同的功效、和相似的功耗以及芯片大小。Cortex-A7通過添加部分雙執(zhí)行,增加TLB和內(nèi)存結(jié)構(gòu),同時集成二級高速緩存,將單時鐘周期性能提高了20%。
高能效CPU產(chǎn)品線的最新成員利用了相同的8級有序流水線,但通過多種方式顯著提升了性能,包括完全雙執(zhí)行流水線、更寬的內(nèi)部總線、增強浮點和SIMD吞吐容量、更大的TLB,以及其他對存儲器系統(tǒng)的改進。cortex-a53包括可選內(nèi)部RAMECC保護,還提供外部總線選項,使得該處理器在移動和企業(yè)應(yīng)用中都可以部署。
除了微架構(gòu)性能改進之外,Cortex-A53還增加了對ARMv8架構(gòu)的支持,為獨立入門級移動芯片設(shè)計,和包含多個Cortex-A53集群的可擴展企業(yè)應(yīng)用引入64位功能,同時在高端移動系統(tǒng)中,將Cortex-A53和性能更強的Cortex-A57在big.LITTLE系統(tǒng)設(shè)計中配對使用。
下圖顯示了連續(xù)幾代高能效Cortex-ACPU的性能對比。因為采用最新的設(shè)計Cortex-A53能夠提供比僅僅幾年前的旗艦級CPU(Cortex-A9)出色的多性能。下圖顯示的性能比較測試是在相同頻率下進行的。在物理實現(xiàn)中,Cortex-A53、Cortex-A7和Cortex-A5的8級流水線達到的頻率和采用更長流水線的“big”Cortex-ACPU能達到的頻率差距在15%之內(nèi)。實際量產(chǎn)SoC頻率存在很大差異,取決于流程選項和后端設(shè)計,我們已經(jīng)看到Cortex-A7在采用28nm制程下可以達到1.2GHz、1.5GHz甚至更高的頻率。
有關(guān)ARM的高效率產(chǎn)品線的更多信息,請參閱KinjalDave的博客–高效率、中端或高性能Cortex-A–差異何在?
移動應(yīng)用處理器全面路線圖
本路線圖將上述所有處理器都集中在單個圖表中,展示了ARM所提供的高性能級別、中端級別、入門級別的移動應(yīng)用程序處理器,以及所支持的高速緩存一致性互聯(lián)組件。
以上路線圖展示了ARM三個級別的移動應(yīng)用處理器產(chǎn)品路線圖,我們未來產(chǎn)品的開發(fā)也將繼續(xù)遵循這一路線。我們專門針對高端、中端和高效率這三個細分市場的處理器設(shè)計,使我們能夠提供針對這三級智能手機和平板電腦市場的定制產(chǎn)品。
為適當(dāng)任務(wù)尋找適當(dāng)處理器不再是難以決斷的選擇
ARM的big.LITTLE技術(shù)旨在為消費者提供最佳整體用戶體驗–包括按需動態(tài)性能、更高的能效、“不發(fā)熱”的耐用器件。市場上最早利用該技術(shù)的產(chǎn)品包括三星GS4(國際版)和三星Note3(國際版)
下圖顯示了將在2013年和2014年推出的采用未來設(shè)計的高端移動CPU子系統(tǒng),將在2014年和2015年的設(shè)備中使用。它采用big.LITTLE電源管理技術(shù),利用Cortex-A57的強大性能,并且提供高速緩存一致性互聯(lián)(cci)功能,能夠為GPU計算提供的IO一致性的支持。
有關(guān)big.LITTLE的更多詳細信息,請參見我近期在ARMTechCon2013上進行的有關(guān)big.LITTLE平臺測量結(jié)果的演示(旨在展示性能改進和節(jié)能):big.LITTLE技術(shù)向完全異構(gòu)全局任務(wù)調(diào)度邁進-Techcon演示文稿
另外,您可能希望閱讀我早期論述該技術(shù)要點的博客–有關(guān)big.LITTLE的十大必備知識
以上系統(tǒng)示意圖展示了最先進的移動CPU設(shè)計,它采用Cortex-A57和Cortex-A53處理器,并且結(jié)合最新的mali_t760GPU。請注意,它具有2個big核心。從我們已經(jīng)進行的性能測試來看,2個big核心似乎已經(jīng)能滿足當(dāng)前工作負載。采用由Cortex-A15和Cortex-A7構(gòu)成的當(dāng)前最高端的移動SoC的拓撲結(jié)構(gòu)示意圖和下圖也是非常類似。Cortex-A50系列處理器代表了將在2014年間問世的移動SoC的未來拓撲結(jié)構(gòu)發(fā)展趨勢…但ARM不會就此止步。我們將繼續(xù)在低功耗CPU、GPU和系統(tǒng)設(shè)計領(lǐng)域開發(fā)新的創(chuàng)新技術(shù),以此推動智能手機、平板電腦和新興設(shè)備類型的創(chuàng)新,實現(xiàn)高效移動計算,提升全球數(shù)十億用戶的生活質(zhì)量。
要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...
關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟