近年來移動平臺SoC發(fā)展飛速,CPU已經(jīng)發(fā)展到四核作為主流,甚至還有新式的“4+4”的架構(gòu)出現(xiàn)。而除了CPU核心數(shù)和頻率的增加,GPU的提升也不可忽視,我們也經(jīng)常會見到有“12核”、“16核”的GPU宣傳,那事實上我們又應(yīng)該怎么判斷這些GPU的核心數(shù)呢?
如果從字面上理解廠家的宣傳,一般消費者很可能會認(rèn)為,“16核”的GPU會強于“12核”的GPU,而“12核”的GPU肯定又要比蘋果、三星的三核、四核GPU要好上許多,那實際情況真的是如此嗎?
如同PC平臺比拼流處理器數(shù)量,移動平臺則開始流行比拼核心數(shù)量,但由于各廠商對于核心的定義不統(tǒng)一,所以往往會讓很多人困惑,現(xiàn)在簡單解析一下常見的幾家廠商對于”核”的概念:
1.ImgTec的PowerVR SGX 5XT系列將一個相對完整的GPU單元視作一個核心。
2.英偉達的Tegra系列的GPU將一個ALU視作一個核心(ALU的數(shù)量用比較統(tǒng)一的MAD ALU作單位,各家對于scalar ALU的作用和定義可能有不同所以暫不計入)。
3.高通的Adreno系列相對不注重核心的宣傳,所以暫忽略。
4.ARM的Mali-T6xx系列將一個統(tǒng)一Shader單元視作一個核心。
5.Vivante的GC系列將一條SIMD Shader流水線視作一個核心。
下面將各家目前的高端GPU做一個表格,以便對比理解:
以上深藍色字體是引用來自百度GPU吧帖子的內(nèi)容(作者:crayon嘻哈小新)
表格可理解為:在不同廠家的標(biāo)準(zhǔn)下,不同的GPU相對這個標(biāo)準(zhǔn)而言的“核心數(shù)”。
附:
ALU:算數(shù)邏輯運算器,因像素著色單元和頂點著色單元都是4個通道,所以GPU的像素著色單元和頂點著色單元都被設(shè)計成具備四次運算能力的ALU。
統(tǒng)一Shader單元既能進行Vertex計算,也能進行Pixel計算。
SIMD Shader(Vec4 Shader):為了提高效率,Shader被設(shè)計成Vec4的SIMD,可對四個數(shù)據(jù)進行打包,然后使用一條指令進行同樣的處理。當(dāng)然如果數(shù)據(jù)少于四個,計算能力就被浪費了。
這里對表格作一個小解釋,我們通常理解的GPU“核心數(shù)”實際上應(yīng)該是完整的GPU單元,從表格中可以看出,只有ImgTec的產(chǎn)品是使用這個標(biāo)準(zhǔn)的,表格中的SGX554MP4即在iPad 4上的GPU,它擁有四個完整的GPU單元,即是我們通常理解的“四核”GPU。類似的情況還有Galaxy S3的Mali-400MP4(四核)和Galaxy S4的SGX544MP3(三核)。而這個表格中,除了Mali-T678是雙核之外,其他包括號稱最強的Tegra4、Adreno320和GC8000其實都只是算我們常規(guī)理解中的單核產(chǎn)品。
從這個表我們又能看出很多非?!按蚰槨钡膯栴}:
相對于NVIDIA的標(biāo)準(zhǔn)來看,不要說是Tegra3的“12核”,就算是6倍ALU的Tegra4,在比拼ALU數(shù)量上還是不如SGX554MP4和Mali-T678的128個,后兩者可以作為NVIDIA標(biāo)準(zhǔn)的“128核”GPU。
相對于Vivante的標(biāo)準(zhǔn)來說,GC8000的“16核”在對比中也并不搶眼,因為SGX554MP4和Mali-T678依然有遙遙領(lǐng)先32個的SIMD Shader(Vec4 Shader),即“32核”。
我們不能忽視GPU的參數(shù),但是這些動輒幾十的“核心”很容易誤導(dǎo)消費者,而我們更應(yīng)該注重的是GPU本身的計算性能,而不應(yīng)該刻意地追求核心數(shù)。
另外還可結(jié)合下圖進行理解: