解讀ARM GPU的三個(gè)發(fā)展趨勢(shì)

時(shí)間：2015-03-25 15:00:06

關(guān)鍵字： ARM GPU

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 隨著智能手機(jī)平板電腦進(jìn)入視網(wǎng)膜屏高清時(shí)代，GPU的重要性日益凸顯，用戶在使用這些電子設(shè)備時(shí)，首先關(guān)注的是高清視頻、3D游戲以及flash動(dòng)畫的體驗(yàn)，而這些體驗(yàn)和GPU性能有直接聯(lián)系，一款性能出色的GPU不但可以給用戶

隨著智能手機(jī)平板電腦進(jìn)入視網(wǎng)膜屏高清時(shí)代，GPU的重要性日益凸顯，用戶在使用這些電子設(shè)備時(shí)，首先關(guān)注的是高清視頻、3D游戲以及flash動(dòng)畫的體驗(yàn)，而這些體驗(yàn)和GPU性能有直接聯(lián)系，一款性能出色的GPU不但可以給用戶以最佳體驗(yàn)，更兼顧低功耗特性，在CPU核戰(zhàn)已無懸念的情況下，未來GPU將如何發(fā)展?近日，電子創(chuàng)新網(wǎng)總編張國(guó)斌獨(dú)家采訪了ARM公司媒體處理部門戰(zhàn)略營(yíng)銷副總裁Kevin Smith，就ARM GPU未來發(fā)展進(jìn)行了交流，歸納為ARM GPU的三個(gè)發(fā)展趨勢(shì)。

趨勢(shì)一：關(guān)注可擴(kuò)展性，GPU核戰(zhàn)爆發(fā)在即

在PC領(lǐng)域，曾經(jīng)爆發(fā)過有關(guān)CPU與GPU誰更重要的口水大戰(zhàn)，現(xiàn)在看來，兩者都重要，因?yàn)樗鼈兗軜?gòu)不同、側(cè)重不同，CPU和GPU都是具有高速運(yùn)算能力的芯片，CPU更像“通才”——指令運(yùn)算+數(shù)值運(yùn)算，GPU更像“專才”——圖形計(jì)算，不同類型的運(yùn)算速度決定了它們的能力。因此CPU更擅長(zhǎng)像操作系統(tǒng)、系統(tǒng)軟件和通用應(yīng)用程序這類擁有復(fù)雜指令調(diào)度、循環(huán)、分支、邏輯判斷的程序任務(wù)，而GPU則擅長(zhǎng)圖形類和非圖形類的高度并行數(shù)值計(jì)算。因此，在一部手機(jī)或者平板中，兩者需要均衡搭配才能發(fā)揮出最大效能。

到目前為止，ARM共發(fā)布了人Mali100、Mali300、Mali400、Mali450和Mali T600等五個(gè)系列的GPU，在MaliT600以后，ARM GPU在結(jié)構(gòu)上發(fā)上了很大改變，以桌面應(yīng)用看齊，在性能上有很大提升。

Mali400結(jié)構(gòu)功能圖

Mali-t604功能圖

Kevin Smith介紹說實(shí)際上在發(fā)布T600系列時(shí)，ARM已經(jīng)考慮到了與未來64位處理器的兼容問題，所以Mali-T600的第二代支持64位雙精度，可以與ARM最新的A50系列64位處理器緊密關(guān)聯(lián)。“另外，T600系列采用了這色器內(nèi)核架構(gòu)和三管道體系，更容易實(shí)現(xiàn)多核，這比其他架構(gòu)GPU更有優(yōu)勢(shì)。” Kevin Smith強(qiáng)調(diào)。“未來ARM會(huì)重點(diǎn)優(yōu)化T600系列產(chǎn)品，例如我們最新發(fā)布的T624\T628\T678就比T604在同等裸片面積性能提升50%!”

他解釋說性能的提升源自對(duì)架構(gòu)的增強(qiáng)，例如這三款系列GPU可在同樣的內(nèi)核面積下提供更高的時(shí)鐘頻率、更高的IPC(每時(shí)鐘周期指令數(shù))、更高的能效，所以每個(gè)型號(hào)的性能都可以提升50%。

另外，這三款GPU也首次次支持ASTC(適應(yīng)性可擴(kuò)展紋理壓縮)：這是一種由ARM開發(fā)、Khronos Group已將其納入OpenGL ES規(guī)范的紋理壓縮技術(shù)，能在系統(tǒng)級(jí)別提高效率，并改進(jìn)紋理質(zhì)量和彈性，“而且，ARM GPU也是率先支持OpenGL ES 3.0版新標(biāo)準(zhǔn)的處理器。”他指出，“我們的GPU支持OpenGL Full Profile的GPU計(jì)算，不但支持OpenGL ES 1.1/2.0/3.0、DX 11/11 FL 9_3，此外還支持Google RenderScript計(jì)算語言。實(shí)際上已經(jīng)向桌面應(yīng)用看齊。也向GPGPU更邁進(jìn)了一步。當(dāng)然，這也是增強(qiáng)兼容性的舉措，我們的策略是就是支持公開的各類標(biāo)準(zhǔn)和API。”

Mali-T678功能框圖

由于GPU的并行架構(gòu)更適合實(shí)現(xiàn)多核，因此為未來多核GPU將是一大亮點(diǎn)，Kevin表示依托ARM的獨(dú)特優(yōu)勢(shì)，未來不管是16核還是24核均可以輕易實(shí)現(xiàn)。

ARM GPU的擴(kuò)展性示意圖

在我采訪Imagination時(shí)，他們也勾勒了一幅未來處理器發(fā)展的藍(lán)圖，顯然，多核GPU是亮點(diǎn)。

未來處理器發(fā)展的藍(lán)圖

那么2013年，主流的GPU產(chǎn)品將是多是核心?Kevin認(rèn)為8核GPU會(huì)出現(xiàn)但將是高端市場(chǎng)，主流市場(chǎng)仍將是四核為主，不過他認(rèn)為明年市場(chǎng)上GPU跨度較大，從單核到雙核到四核到8核都有出現(xiàn)，滿足市場(chǎng)從低到高的需求。

近日，谷歌Nexus 10平板電腦已經(jīng)面市，它的真實(shí)面貌。該機(jī)采用一塊10英寸屏幕，分辨率高達(dá)2560×1600像素，像素密度為300ppi，超過了iPad4和新iPad，它采用了1.7GHz主頻的三星Exynos 5250雙核處理器，配備2GB RAM，集成Mali T604四核GPU，Kevin強(qiáng)調(diào)這樣高端機(jī)型足以說明ARM GPU可以支持高端應(yīng)用。

在GPU的發(fā)展策略上，Kevin介紹說ARM會(huì)堅(jiān)持以較小的面積實(shí)現(xiàn)更高的性能，即堅(jiān)持高能效的策略，同時(shí)，會(huì)考慮高性能方向，向桌面GPU看齊。

以下是各類GPU的功耗對(duì)比，可以看出，ARM GPU在單位功耗方面的性能突出，能達(dá)到每瓦48GFLOPS的特性，原高于桌面GPU的能效。

處理器	類型	GFLOPS (32bit)	GFLOPS (64bit)	Watt (TDP)	GFLOPS/Watt (32bit)	FLOPS/Watt (64bit)
Adapteva Epiphany-IV	Epiphany	100	N/A	2	50	N/A
Movidius Myriad	ARM SoC: LEON3+SHAVE	15.28	N/A	0.32	48	N/A
ZiiLabs	ARM SoC	58	N/A	?	20?	N/A
Nvidia Tesla K10	X86 GPU	4577	190	225	20.34	?
ARM + MALI T604	ARM SoC	8 + 68	N/A	4?	19?	N/A
NVidia GTX 690	X86 GPU x 2	5621	234?	300	18.74	0.78
GeForce GTX 680	X86 GPU	3090	128	195	15.85	0.65
AMD Radeon HD 7970 GHz	X86 GPU	4300	1075	300+	14.3	3.58
Intel Knight's Corner (Xeon Phi)	X87?	2000?	1000	200?	10?	5?
AMD A10-5800K + HD 7660D	X86 SoC	121 + 614	?	100	7.35	?
Intel Core i7-3770 + HD4000	X86 SoC	225 + 294,4	112 + 73.6	77	6.74	2.41
NVIDIA CARMA (complete board)	ARM + GPU	? + 200	?	40	5.00	?
IBM Power A2	Power CPU	204?	204	55	3.72?	3.72
Intel Core i7-3770	X86 CPU	225	112	?	?	?
AMD A10-5800K	X86 CPU	121	60?	?	?	?

趨勢(shì)二：關(guān)注一致性，與CPU融合

在PC處理器領(lǐng)域，AMD以融合CPU和GPU的APU開創(chuàng)了新的PC處理器領(lǐng)域，在移動(dòng)處理器領(lǐng)域，這個(gè)趨勢(shì)仍將延續(xù)，從近日Imagination對(duì)MIPS的收購(gòu)已經(jīng)顯現(xiàn)端倪。Kevin也認(rèn)同這個(gè)趨勢(shì)，“ARM的GPU不但注重圖形處理更看重通用計(jì)算，未來CPU與GPU要走融合的道路，所以ARM在布局GPU時(shí)就考慮與未來CPU的搭配，比如我們的GPU是支持64位處理器的，所以未來處理器升級(jí)到64位我們都可以支持。”他指出，“ARM考慮到是讓用戶用最快的方式實(shí)現(xiàn)低功耗高性能處理器，未來融合CPU與GPU的Soc內(nèi)部會(huì)采用ARM的AMBA總線。”

實(shí)際上，在ARM的的Mali-T600 系列 GPU 內(nèi)的有個(gè)作業(yè)管理器，它可以任務(wù)管理從 CPU 卸載到 GPU，并在活動(dòng)著色器內(nèi)核之間實(shí)現(xiàn)無縫負(fù)載平衡。這個(gè)功能估計(jì)已經(jīng)為未來的CPU與GPU融合埋下了伏筆，通過 ARM 的一致性和互連技術(shù)，計(jì)算任務(wù)在異類系統(tǒng)中進(jìn)行共享處理時(shí)，可以輕松跨越 CPU、GPU 和其他可用計(jì)算資源，更高效地訪問數(shù)據(jù)。

他強(qiáng)調(diào)ARM GPU還關(guān)注通用計(jì)算，因此，未來也將壓縮DSP市場(chǎng)，CEVA是否感受到了壓力?

從支持64位處理里來看，未來采用融合CPU與GPU的處理器將是A50系列處理器，按照某些芯片廠商的估計(jì)，預(yù)計(jì)2014年此類芯片可以面市。

趨勢(shì)三：工藝升級(jí)，2014年ARM處理器采用finFET技術(shù)?

很多人認(rèn)為ARM處理器在傳統(tǒng)工藝上的升級(jí)空間已經(jīng)不大，在英特爾大張旗鼓地宣傳3D晶體管技術(shù)的時(shí)候，ARM 其實(shí)也也已經(jīng)開始了下一代工藝技術(shù)的研發(fā)，Kevin透露ARM的PIP(物理IP)部門早與TSMC以及Global Foundries合作開始了下一代工藝finFET晶體管工藝技術(shù)的研發(fā)，這是前所未有的，預(yù)計(jì)新的工藝技術(shù)將在TSMC的16nm工藝和Global Foundries上的14nm上實(shí)現(xiàn)，而新工藝可能會(huì)用于ARM下一代64位處理器上。

在具體產(chǎn)品發(fā)展上，在ARM公布了最新的A50系列處理器后，已經(jīng)有AMD、博通(Broadcom)、Calxeda、海思半導(dǎo)體、三星及意法半導(dǎo)體等七家公司獲得A53與A57處理器授權(quán)，其中，STE聲稱將在2014年出貨A53處理器，這是否意味著2014年ARM處理器將采用finFET工藝技術(shù)?

在今年1月召開的2012國(guó)際電子器件會(huì)議(IEDM)上，TSMC已經(jīng)展示有關(guān)finFET晶體管工藝技術(shù)，臺(tái)積電將提供的16nm工藝金屬布線部分直接沿襲20nm工藝，將晶體管部分換成16nm工藝的FinFET。與20nm工藝相比，可使晶體管的工作速度提高20%～25%，使耗電量降低35%。由于金屬布線部分在20nm工藝和16nm工藝間通用，因此兩工藝的芯片面積相同。與intel的工藝不同，臺(tái)積電的finFET晶體管摻入了鍺材料。

TSMC展示有關(guān)finFET晶體管工藝技術(shù)

以下為采用主要GPU的處理器性能對(duì)比

GPU	應(yīng)用芯片	應(yīng)用設(shè)備	運(yùn)算能力（GFLOPS at 200 MHz）	GFLOPS in SoC
PowerVR SGX543MP4+	PSVita	PlayStation Vita	25.6	25.6+
PowerVR SGX543MP2	Apple A5	Apple iPhone 4S	12.8	16 at 250 MHz*
Mali-400 MP4	Exynos 4210	Samsung Galaxy S II	7.2	9.9 at 275 MHz
"Kal-El" GeForce	Tegra 3	ASUS Transformer Prime	4.8	9.6 at 400 MHz*
PowerVR SGX540	OMAP4460	Galaxy Nexus	3.2	6.1 at 384 MHz
Adreno 220	MSM8260	HTC Sensation	N/A	N/A
ULP GeForce	Tegra 2	Motorola Xoom	3.2	5.3 at 333 MHz
PowerVR SGX540	OMAP4430	Motorola Droid Razr	3.2	4.8 at 304 MHz
ULP GeForce	Tegra 2	LG Optimus 2X	3.2	4.8 at 300 MHz
PowerVR SGX540	Hummingbird	Samsung Galaxy S	3.2	3.2 at 200 MHz
Adreno 205	MSM8255	HTC Titan	N/A	N/A
PowerVR SGX535	Apple A4	iPhone 4	1.6	1.6 at 200 MHz*
PowerVR SGX530	OMAP3630	Motorola Droid X	1.6	1.6 at 200 MHz
Adreno 200	QSD8250	HTC HD 7	N/A	N/A