NVIDIA的MCM-GPU芯片比多核GPU更厲害?
NVIDIA在GTC 2017上發(fā)布了基于Volta架構(gòu)的旗艦計(jì)算卡Tesla V100,這可是NVIDIA制造出有史以來(lái)最多晶體管的GPU,足足有5120個(gè)CUDA單元,比上一代增長(zhǎng)了42%,盡管使用了臺(tái)積電最先進(jìn)的12nm FFN工藝,但是GPU核心面積已經(jīng)暴漲至815mm2水平。盡管Tesla V100性能足夠強(qiáng)大,不過NVIDIA似乎仍不滿足,在一篇研究論文中透露,NVIDIA正在積極探索MCM-GPU的東西,說白了其實(shí)就是如何最優(yōu)化整合多個(gè)GPU模塊在一起,每個(gè)GPU都發(fā)揮出百分百的實(shí)力。
在GTC 2017上NVIDIA CEO黃仁勛曾說過“目前制造高性能GPU有一個(gè)很嚴(yán)重的限制——芯片尺寸的限制,因?yàn)槟壳艾F(xiàn)有技術(shù)的光刻機(jī)受限于光刻模板、光刻光源,幾乎不可能制造出更大的GPU核心”。單GPU核心價(jià)值幾乎被榨干殆盡,堆流處理器提升性能即將進(jìn)入歷史的墳?zāi)?,因此核心尺寸不能無(wú)止境變大已經(jīng)成為NVIDIA繼續(xù)提升GPU性能的瓶頸。
因此NVIDIA想到了“膠水**”,就是講多個(gè)GPU核心通過某種方式連接起來(lái),組成一個(gè)GPU整體實(shí)行運(yùn)算。這個(gè)方法可能就像是之前的GTX 590,兩個(gè)Fermi架構(gòu)的GF110-351核心整合到同一塊PCB上,不過這樣的壞處顯而易見,類似于SLI、CF一樣,由于兩個(gè)核心之間連接的數(shù)據(jù)鏈路帶寬、速度、任務(wù)調(diào)度存在大量問題,沒有產(chǎn)生1+1=2的實(shí)際效果,雙芯卡的命運(yùn)也就漸漸沒落了。
NVIDIA現(xiàn)在要做的就是探索出一種高效連接多個(gè)GPU的方案,MCM-GPU就是這樣一個(gè)具有前瞻性的實(shí)驗(yàn)項(xiàng)目。Multi-Chip-Module Package這種形式的封裝其實(shí)有點(diǎn)類似于閃存的做法,16層容量不夠,那就堆高,堆到64層。這樣的好處不僅是制造方式簡(jiǎn)單,成本有優(yōu)勢(shì),還可以成倍地提高性能。目前,NVIDIA內(nèi)部的模擬測(cè)試中,研究團(tuán)隊(duì)已經(jīng)在研究“堆砌”SMs單元,目前進(jìn)度已經(jīng)研發(fā)至256組SMs單元(大家算一算有多少個(gè)CUDA單元),而Pascal最強(qiáng)的Tesla P100只有56組,Volta最強(qiáng)的Tesla V100也僅僅為80組。說的白了,其實(shí)就像我們的高樓大廈,土地面積不夠,我們就往高處建,MCM-GPU同樣也是疊高,節(jié)省核心面積。如果研發(fā)過程順利,以后GPU顯卡性能暴增不是夢(mèng)!
NVIDIA表示MCM-GPU與今天的最大GPU核心相比,可以縮小40-60%的核心面積,將來(lái)還可能會(huì)用上10nm或者轉(zhuǎn)折性的7nm工藝制造。
此外還有一個(gè)很嚴(yán)峻的問題,不同層之間的SM單元到底如何連接,如何使用顯存依然是個(gè)頭疼的問題。因此NVIDIA在將來(lái)還有很長(zhǎng)的路要走,但是這個(gè)MCM-GPU設(shè)計(jì)有望在明年的CTG大會(huì)上與我們見面,適用于下一代顯卡架構(gòu)上。
MCM-GPU性能要比普通的多核心GPU性能更好。