NVIDIA的MCM－GPU芯片比多核GPU更厲害？

時(shí)間：2017-07-07 14:41:06

關(guān)鍵字： GPU NVIDIA 技術(shù)前沿芯片

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]NVIDIA在GTC 2017上發(fā)布了基于Volta架構(gòu)的旗艦計(jì)算卡Tesla V100，這可是NVIDIA制造出有史以來最多晶體管的GPU，足足有5120個(gè)CUDA單元，比上一代增長了42%，盡管使用了臺積電最先進(jìn)的12nm FFN工藝，但是GPU核心面積已經(jīng)暴漲至815mm2水平。盡管Tesla V100性能足夠強(qiáng)大，不過NVIDIA似乎仍不滿足，在一篇研究論文中透露，NVIDIA正在積極探索MCM-GPU的東西，說白了其實(shí)就是如何最優(yōu)化整合多個(gè)GPU模塊在一起，每個(gè)GPU都發(fā)揮出百分百的實(shí)力。

NVIDIA在GTC 2017上發(fā)布了基于Volta架構(gòu)的旗艦計(jì)算卡Tesla V100，這可是NVIDIA制造出有史以來最多晶體管的GPU，足足有5120個(gè)CUDA單元，比上一代增長了42%，盡管使用了臺積電最先進(jìn)的12nm FFN工藝，但是GPU核心面積已經(jīng)暴漲至815mm2水平。盡管Tesla V100性能足夠強(qiáng)大，不過NVIDIA似乎仍不滿足，在一篇研究論文中透露，NVIDIA正在積極探索MCM-GPU的東西，說白了其實(shí)就是如何最優(yōu)化整合多個(gè)GPU模塊在一起，每個(gè)GPU都發(fā)揮出百分百的實(shí)力。

在GTC 2017上NVIDIA CEO黃仁勛曾說過“目前制造高性能GPU有一個(gè)很嚴(yán)重的限制——芯片尺寸的限制，因?yàn)槟壳艾F(xiàn)有技術(shù)的光刻機(jī)受限于光刻模板、光刻光源，幾乎不可能制造出更大的GPU核心”。單GPU核心價(jià)值幾乎被榨干殆盡，堆流處理器提升性能即將進(jìn)入歷史的墳?zāi)梗虼撕诵某叽绮荒軣o止境變大已經(jīng)成為NVIDIA繼續(xù)提升GPU性能的瓶頸。

因此NVIDIA想到了“膠水**”，就是講多個(gè)GPU核心通過某種方式連接起來，組成一個(gè)GPU整體實(shí)行運(yùn)算。這個(gè)方法可能就像是之前的GTX 590，兩個(gè)Fermi架構(gòu)的GF110-351核心整合到同一塊PCB上，不過這樣的壞處顯而易見，類似于SLI、CF一樣，由于兩個(gè)核心之間連接的數(shù)據(jù)鏈路帶寬、速度、任務(wù)調(diào)度存在大量問題，沒有產(chǎn)生1+1=2的實(shí)際效果，雙芯卡的命運(yùn)也就漸漸沒落了。

NVIDIA現(xiàn)在要做的就是探索出一種高效連接多個(gè)GPU的方案，MCM-GPU就是這樣一個(gè)具有前瞻性的實(shí)驗(yàn)項(xiàng)目。Multi-Chip-Module Package這種形式的封裝其實(shí)有點(diǎn)類似于閃存的做法，16層容量不夠，那就堆高，堆到64層。這樣的好處不僅是制造方式簡單，成本有優(yōu)勢，還可以成倍地提高性能。目前，NVIDIA內(nèi)部的模擬測試中，研究團(tuán)隊(duì)已經(jīng)在研究“堆砌”SMs單元，目前進(jìn)度已經(jīng)研發(fā)至256組SMs單元(大家算一算有多少個(gè)CUDA單元)，而Pascal最強(qiáng)的Tesla P100只有56組，Volta最強(qiáng)的Tesla V100也僅僅為80組。說的白了，其實(shí)就像我們的高樓大廈，土地面積不夠，我們就往高處建，MCM-GPU同樣也是疊高，節(jié)省核心面積。如果研發(fā)過程順利，以后GPU顯卡性能暴增不是夢!

NVIDIA表示MCM-GPU與今天的最大GPU核心相比，可以縮小40-60%的核心面積，將來還可能會用上10nm或者轉(zhuǎn)折性的7nm工藝制造。

此外還有一個(gè)很嚴(yán)峻的問題，不同層之間的SM單元到底如何連接，如何使用顯存依然是個(gè)頭疼的問題。因此NVIDIA在將來還有很長的路要走，但是這個(gè)MCM-GPU設(shè)計(jì)有望在明年的CTG大會上與我們見面，適用于下一代顯卡架構(gòu)上。

MCM-GPU性能要比普通的多核心GPU性能更好。