ARM Mali-G71 詳細(xì)解讀
Mali-G71圖形處理器(GPU)是Mali 高性能GPU家族最新推出的頂級(jí)產(chǎn)品。Mali-G71基于全新Bifrost架構(gòu),代表了高端移動(dòng)圖像處理性能的最高水平,進(jìn)一步奠定了Mali在競(jìng)爭(zhēng)激烈GPU市場(chǎng)的主導(dǎo)地位。
Mali-G71研發(fā)期間充分參考了包括虛擬現(xiàn)實(shí)(VR)、增強(qiáng)現(xiàn)實(shí)(AR)、以及3D游戲在內(nèi)等高端移動(dòng)應(yīng)用核心需求,這些應(yīng)用場(chǎng)景將繼續(xù)快速發(fā)展;同時(shí),包括Vulkan及OpenCL 2.0在內(nèi)的現(xiàn)代API也是研發(fā)要點(diǎn)。“貪吃蛇”的時(shí)代早已成為歷史,移動(dòng)游戲行業(yè)的飛速發(fā)展令人目不暇接,即便是高端設(shè)備也越來越無法滿足下一代移動(dòng)游戲的要求。針對(duì)這一問題,Mali-G71著眼于下一代移動(dòng)圖像處理技術(shù),讓搭載Mali-G71的設(shè)備更強(qiáng)勁、更高效、更出色。使用Mali-G71 GPU的設(shè)備,其圖像處理性能甚至可與中端筆記本相媲美。
關(guān)于Bifrost架構(gòu)
Mali的全新Bifrost架構(gòu)標(biāo)志著GPU領(lǐng)域的飛躍以及移動(dòng)圖像處理技術(shù)的未來。Bifrost架構(gòu)設(shè)計(jì)蘊(yùn)含大量創(chuàng)新和優(yōu)化,下面將對(duì)此做簡(jiǎn)要說明。
指令組著色器(Claused Shader)將指令集分組到預(yù)先設(shè)置好的程序塊,使指令組可以自動(dòng)執(zhí)行且不會(huì)中斷。基于此,我們可以確保所有外部依賴在子句執(zhí)行前便已就緒;通過設(shè)計(jì)執(zhí)行單元,臨時(shí)結(jié)果也無需訪問寄存器組。這便緩解了對(duì)寄存器文件的壓力,顯著降低功耗;通過簡(jiǎn)化執(zhí)行單元的控制邏輯,GPU的面積也得以縮小。
指令組著色器顯著降低功耗
Bifrost架構(gòu)的另一創(chuàng)新在于其采用基于Quad的矢量化技術(shù)。Midgard GPU采用單指令多數(shù)據(jù)結(jié)構(gòu)(SIMD )矢量化技術(shù),管道階段一次只執(zhí)行單一線程;且非常依賴著色器代碼執(zhí)行向量指令。Quad矢量化技術(shù)最高支持四線程同步執(zhí)行,共享控制邏輯,降低執(zhí)行單元的填充難度,使用率將近100%,深度匹配開發(fā)人員編寫著色器代碼的最新方法。
高可拓展性
前代高性能移動(dòng)GPU只支持1到16核擴(kuò)展。為了滿足移動(dòng)設(shè)備不斷提高的性能需求,全新Mali-G71支持1到32核拓展。利用Mali-G71的高可擴(kuò)展性,無論DTV設(shè)備、高性能智能手機(jī),還是最新的VR設(shè)備;無論是移動(dòng)版本還是單機(jī)版本,均可實(shí)現(xiàn)強(qiáng)勁的圖像處理性能。Mali-G71的可拓展性及40% 的面積效率提升,助力合作伙伴更能隨心所欲地按照目標(biāo)要求開發(fā)系統(tǒng),在功耗、效率和成本間實(shí)現(xiàn)平衡,更精準(zhǔn)地實(shí)現(xiàn)產(chǎn)品在目標(biāo)市場(chǎng)的定位。
適用于高端游戲
移動(dòng)游戲正迅速成為世界各地游戲玩家的首選游戲平臺(tái)。2017年,移動(dòng)游戲市場(chǎng)規(guī)模超過400億美元,較2016年增加100億美元。移動(dòng)設(shè)備性能的不斷提高,為移動(dòng)游戲市場(chǎng)的持續(xù)增長(zhǎng)奠定了基礎(chǔ);隨著復(fù)雜性逐年上升,移動(dòng)游戲市場(chǎng)的增長(zhǎng)也面臨挑戰(zhàn)。數(shù)年前發(fā)布的游戲演示程序,其頂點(diǎn)數(shù)量只有現(xiàn)在的一半,因此對(duì)功耗和效率的要求更高。如果應(yīng)用程序繼續(xù)以這一速率發(fā)展,32核可拓展性將成為高端移動(dòng)設(shè)備的標(biāo)準(zhǔn)配置。此外,Mali-G71 在相似條件下的能效比Mali-T880高出20%,受散熱限制的高端設(shè)備也可以擁有更持久的性能。
支持Vulkan和OpenCL2.0
我們必須充分關(guān)注API的發(fā)展,畢竟,API定義了開發(fā)人員與底層硬件的交互方式。作為一家GPU和CPU技術(shù)公司,我們需要不斷滿足開發(fā)人員的需求,才能保證終端用戶獲得最佳設(shè)備體驗(yàn)。近年來,發(fā)展的一大趨勢(shì)就是允許開發(fā)人員以低級(jí)別權(quán)限訪問硬件;因此,Khronos公司應(yīng)勢(shì)推出全新Vulkan 1.0 API。類似地,OpenCL2.0提升了異構(gòu)計(jì)算對(duì)開發(fā)人員的友好度;將來,隨著OpenCL2.0設(shè)備投放市場(chǎng),更為典型的使用案例將會(huì)逐漸涌現(xiàn)。得益于完整硬件一致性,Mali-G71不僅支持Vulkan 1.0和OpenCL 2.0 Full Profile,還支持細(xì)紋理緩沖及共享虛擬內(nèi)存;同時(shí),還可降低軟件開發(fā)難度,優(yōu)化終端用戶體驗(yàn)。
轉(zhuǎn)為虛擬現(xiàn)實(shí)(VR)量身打造
虛擬現(xiàn)實(shí)是圖像處理領(lǐng)域的熱門話題,包括虛擬現(xiàn)實(shí)如何實(shí)現(xiàn),需要什么條件,如何為用戶提供最佳的VR體驗(yàn)等三個(gè)方面。Mali-G71 GPU正是基于這類需求量身打造。VR技術(shù)全面的性能需求,意味著高端設(shè)備的GPU技術(shù)必須具有更高能效。另外,攝像頭和屏幕等手機(jī)組件也正以前所未有的速度發(fā)展,并且設(shè)備的受熱性能也面臨嚴(yán)峻挑戰(zhàn)。因此,GPU必須全力降低能耗。
Mali GPU系列產(chǎn)品支持多項(xiàng)先進(jìn)VR優(yōu)化功能,營造最佳移動(dòng)VR體驗(yàn)。利用前置緩沖技術(shù),無需離屏緩沖區(qū)便可直接向前置緩存區(qū)提交數(shù)據(jù),節(jié)約時(shí)間,降低延遲;Mali同時(shí)支持API“多視角”拓展,應(yīng)用程序每次可向驅(qū)動(dòng)提交單幀繪畫指令,驅(qū)動(dòng)可為每只眼睛分配具體任務(wù),顯著降低應(yīng)用和驅(qū)動(dòng)CPU的處理時(shí)間。針對(duì)基于Midgard和Bifrost的Mali GPU,我們進(jìn)一步優(yōu)化了頂點(diǎn)處理技術(shù),單次頂點(diǎn)處理,雙眼共享結(jié)果。除上述特色外,還有多項(xiàng)其他特色,使Mali-G71成為未來移動(dòng)VR的首選。
強(qiáng)大的內(nèi)容保護(hù)
如今,我們使用手機(jī)的頻率越來越高;對(duì)許多人來講,臺(tái)式機(jī)或筆記本已經(jīng)不是必需品,因?yàn)槭謾C(jī)即可處理所有事情,比如下載、瀏覽內(nèi)容、向其他設(shè)備傳輸文件等。近期上市的Mali-DP650顯示處理器可處理4k內(nèi)容,Mali-G71將內(nèi)容無縫、保真地將內(nèi)容傳輸?shù)诫娨暽稀1M管4k還沒有在手機(jī)上普及,但當(dāng)在其他4k設(shè)備上瀏覽內(nèi)容時(shí),性能不會(huì)有任何損失。
Mali-G71的移動(dòng)圖像處理性能處于當(dāng)前最高水平,且功耗和芯片面積最小。合作伙伴在享受最具拓展性及個(gè)性化技術(shù)的同時(shí),可實(shí)現(xiàn)移動(dòng)圖像處理技術(shù)的巔峰。Mali-G71預(yù)計(jì)將于2017年投入市場(chǎng),屆時(shí)新一代移動(dòng)游戲和圖像處理技術(shù)與您只有咫尺之遙。