解讀ARM GPU的三個(gè)發(fā)展趨勢(shì)
隨著智能手機(jī)平板電腦進(jìn)入視網(wǎng)膜屏高清時(shí)代,GPU的重要性日益凸顯,用戶在使用這些電子設(shè)備時(shí),首先關(guān)注的是高清視頻、3D游戲以及flash動(dòng)畫的體驗(yàn),而這些體驗(yàn)和GPU性能有直接聯(lián)系,一款性能出色的GPU不但可以給用戶以最佳體驗(yàn),更兼顧低功耗特性,在CPU核戰(zhàn)已無懸念的情況下,未來GPU將如何發(fā)展?近日,電子創(chuàng)新網(wǎng)總編張國(guó)斌獨(dú)家采訪了ARM公司媒體處理部門戰(zhàn)略營(yíng)銷副總裁Kevin Smith,就ARM GPU未來發(fā)展進(jìn)行了交流,歸納為ARM GPU的三個(gè)發(fā)展趨勢(shì)。
趨勢(shì)一:關(guān)注可擴(kuò)展性,GPU核戰(zhàn)爆發(fā)在即
在PC領(lǐng)域,曾經(jīng)爆發(fā)過有關(guān)CPU與GPU誰更重要的口水大戰(zhàn),現(xiàn)在看來,兩者都重要,因?yàn)樗鼈兗軜?gòu)不同、側(cè)重不同,CPU和GPU都是具有高速運(yùn)算能力的芯片,CPU更像“通才”——指令運(yùn)算+數(shù)值運(yùn)算,GPU更像“專才”——圖形計(jì)算,不同類型的運(yùn)算速度決定了它們的能力。因此CPU更擅長(zhǎng)像操作系統(tǒng)、系統(tǒng)軟件和通用應(yīng)用程序這類擁有復(fù)雜指令調(diào)度、循環(huán)、分支、邏輯判斷的程序任務(wù),而GPU則擅長(zhǎng)圖形類和非圖形類的高度并行數(shù)值計(jì)算。因此,在一部手機(jī)或者平板中,兩者需要均衡搭配才能發(fā)揮出最大效能。
到目前為止,ARM共發(fā)布了人Mali100、Mali300、Mali400、Mali450和Mali T600等五個(gè)系列的GPU,在MaliT600以后,ARM GPU在結(jié)構(gòu)上發(fā)上了很大改變,以桌面應(yīng)用看齊,在性能上有很大提升。
Mali400結(jié)構(gòu)功能圖
Mali-t604功能圖
Kevin Smith介紹說實(shí)際上在發(fā)布T600系列時(shí),ARM已經(jīng)考慮到了與未來64位處理器的兼容問題,所以Mali-T600的第二代支持64位雙精度,可以與ARM最新的A50系列64位處理器緊密關(guān)聯(lián)。“另外,T600系列采用了這色器內(nèi)核架構(gòu)和三管道體系,更容易實(shí)現(xiàn)多核,這比其他架構(gòu)GPU更有優(yōu)勢(shì)。” Kevin Smith強(qiáng)調(diào)。“未來ARM會(huì)重點(diǎn)優(yōu)化T600系列產(chǎn)品,例如我們最新發(fā)布的T624\T628\T678就比T604在同等裸片面積性能提升50%!”
他解釋說性能的提升源自對(duì)架構(gòu)的增強(qiáng),例如這三款系列GPU可在同樣的內(nèi)核面積下提供更高的時(shí)鐘頻率、更高的IPC(每時(shí)鐘周期指令數(shù))、更高的能效,所以每個(gè)型號(hào)的性能都可以提升50%。
另外,這三款GPU也首次次支持ASTC(適應(yīng)性可擴(kuò)展紋理壓縮):這是一種由ARM開發(fā)、Khronos Group已將其納入OpenGL ES規(guī)范的紋理壓縮技術(shù),能在系統(tǒng)級(jí)別提高效率,并改進(jìn)紋理質(zhì)量和彈性,“而且,ARM GPU也是率先支持OpenGL ES 3.0版新標(biāo)準(zhǔn)的處理器。”他指出,“我們的GPU支持OpenGL Full Profile的GPU計(jì)算,不但支持OpenGL ES 1.1/2.0/3.0、DX 11/11 FL 9_3,此外還支持Google RenderScript計(jì)算語言。實(shí)際上已經(jīng)向桌面應(yīng)用看齊。也向GPGPU更邁進(jìn)了一步。當(dāng)然,這也是增強(qiáng)兼容性的舉措,我們的策略是就是支持公開的各類標(biāo)準(zhǔn)和API。”
Mali-T678功能框圖
由于GPU的并行架構(gòu)更適合實(shí)現(xiàn)多核,因此為未來多核GPU將是一大亮點(diǎn),Kevin表示依托ARM的獨(dú)特優(yōu)勢(shì),未來不管是16核還是24核均可以輕易實(shí)現(xiàn)。
ARM GPU的擴(kuò)展性示意圖
在我采訪Imagination時(shí),他們也勾勒了一幅未來處理器發(fā)展的藍(lán)圖,顯然,多核GPU是亮點(diǎn)。
未來處理器發(fā)展的藍(lán)圖
那么2013年,主流的GPU產(chǎn)品將是多是核心?Kevin認(rèn)為8核GPU會(huì)出現(xiàn)但將是高端市場(chǎng),主流市場(chǎng)仍將是四核為主,不過他認(rèn)為明年市場(chǎng)上GPU跨度較大,從單核到雙核到四核到8核都有出現(xiàn),滿足市場(chǎng)從低到高的需求。
近日,谷歌Nexus 10平板電腦已經(jīng)面市,它的真實(shí)面貌。該機(jī)采用一塊10英寸屏幕,分辨率高達(dá)2560×1600像素,像素密度為300ppi,超過了iPad4和新iPad,它采用了1.7GHz主頻的三星Exynos 5250雙核處理器,配備2GB RAM,集成Mali T604四核GPU,Kevin強(qiáng)調(diào)這樣高端機(jī)型足以說明ARM GPU可以支持高端應(yīng)用。
在GPU的發(fā)展策略上,Kevin介紹說ARM會(huì)堅(jiān)持以較小的面積實(shí)現(xiàn)更高的性能,即堅(jiān)持高能效的策略,同時(shí),會(huì)考慮高性能方向,向桌面GPU看齊。
以下是各類GPU的功耗對(duì)比,可以看出,ARM GPU在單位功耗方面的性能突出,能達(dá)到每瓦48GFLOPS的特性,原高于桌面GPU的能效。
趨勢(shì)二:關(guān)注一致性,與CPU融合
在PC處理器領(lǐng)域,AMD以融合CPU和GPU的APU開創(chuàng)了新的PC處理器領(lǐng)域,在移動(dòng)處理器領(lǐng)域,這個(gè)趨勢(shì)仍將延續(xù),從近日Imagination對(duì)MIPS的收購(gòu)已經(jīng)顯現(xiàn)端倪。Kevin也認(rèn)同這個(gè)趨勢(shì),“ARM的GPU不但注重圖形處理更看重通用計(jì)算,未來CPU與GPU要走融合的道路,所以ARM在布局GPU時(shí)就考慮與未來CPU的搭配,比如我們的GPU是支持64位處理器的,所以未來處理器升級(jí)到64位我們都可以支持。”他指出,“ARM考慮到是讓用戶用最快的方式實(shí)現(xiàn)低功耗高性能處理器,未來融合CPU與GPU的Soc內(nèi)部會(huì)采用ARM的AMBA總線。”
實(shí)際上,在ARM的的Mali-T600 系列 GPU 內(nèi)的有個(gè)作業(yè)管理器,它可以任務(wù)管理從 CPU 卸載到 GPU,并在活動(dòng)著色器內(nèi)核之間實(shí)現(xiàn)無縫負(fù)載平衡。這個(gè)功能估計(jì)已經(jīng)為未來的CPU與GPU融合埋下了伏筆,通過 ARM 的一致性和互連技術(shù),計(jì)算任務(wù)在異類系統(tǒng)中進(jìn)行共享處理時(shí),可以輕松跨越 CPU、GPU 和其他可用計(jì)算資源,更高效地訪問數(shù)據(jù)。
他強(qiáng)調(diào)ARM GPU還關(guān)注通用計(jì)算,因此,未來也將壓縮DSP市場(chǎng),CEVA是否感受到了壓力?
從支持64位處理里來看,未來采用融合CPU與GPU的處理器將是A50系列處理器,按照某些芯片廠商的估計(jì),預(yù)計(jì)2014年此類芯片可以面市。
趨勢(shì)三:工藝升級(jí),2014年ARM處理器采用finFET技術(shù)?
很多人認(rèn)為ARM處理器在傳統(tǒng)工藝上的升級(jí)空間已經(jīng)不大,在英特爾大張旗鼓地宣傳3D晶體管技術(shù)的時(shí)候,ARM 其實(shí)也也已經(jīng)開始了下一代工藝技術(shù)的研發(fā),Kevin透露ARM的PIP(物理IP)部門早與TSMC以及Global Foundries合作開始了下一代工藝finFET晶體管工藝技術(shù)的研發(fā),這是前所未有的,預(yù)計(jì)新的工藝技術(shù)將在TSMC的16nm工藝 和Global Foundries上的14nm上實(shí)現(xiàn),而新工藝可能會(huì)用于ARM下一代64位處理器上。
在具體產(chǎn)品發(fā)展上,在ARM公布了最新的A50系列處理器后,已經(jīng)有AMD、博通(Broadcom)、Calxeda、海思半導(dǎo)體、三星及意法半導(dǎo)體等七家公司獲得A53與A57處理器授權(quán),其中,STE聲稱將在2014年出貨A53處理器,這是否意味著2014年ARM處理器將采用finFET工藝技術(shù)?
在今年1月召開的2012國(guó)際電子器件會(huì)議(IEDM)上,TSMC已經(jīng)展示有關(guān)finFET晶體管工藝技術(shù),臺(tái)積電將提供的16nm工藝金屬布線部分直接沿襲20nm工藝,將晶體管部分換成16nm工藝的FinFET。與20nm工藝相比,可使晶體管的工作速度提高20%~25%,使耗電量降低35%。由于金屬布線部分在20nm工藝和16nm工藝間通用,因此兩工藝的芯片面積相同。與intel的工藝不同,臺(tái)積電的finFET晶體管摻入了鍺材料。
TSMC展示有關(guān)finFET晶體管工藝技術(shù)
以下為采用主要GPU的處理器性能對(duì)比