NVIDIA Turing GPU架構(gòu)圖泄露,發(fā)現(xiàn)了這些...
8月21日,NVIDIA終于在德國發(fā)布了新一代游戲顯卡,在發(fā)布會(huì)上,NVIDIA將大家注意力全都集中到了光線追蹤技術(shù)上,而昨天我們也在超能課堂中進(jìn)行了詳細(xì)介紹。不知道大家發(fā)現(xiàn)沒,目前對(duì)于新一代圖靈架構(gòu)顯卡,除了知道個(gè)名字,知道加入了RT Core以外,其余一概不知,甚至連一張?jiān)敿?xì)的GPU架構(gòu)圖都沒有,這個(gè)情況在以往都沒有出現(xiàn)過。不過萬能的VideoCardZ居然找到一張標(biāo)著Turing GPU架構(gòu)圖片,我們可以從中發(fā)現(xiàn)一些端倪。
來自VideoCardZ,圖片可放大
泄露的是TU102核心的架構(gòu)圖,也是Quadro RTX 8000、Quadro RTX 6000專業(yè)卡以及RTX 2080 Ti游戲卡所采用的核心。不過只有Quadro RTX 8000、Quadro RTX 6000專業(yè)卡采用了完整版的TU102核心,RTX 2080 Ti依然是不完整的,也就是我們了解到的TU102-300核心。
上面標(biāo)注的信息分別為“72組SM單元,4608個(gè)CUDA單元,576個(gè)Tensor核心,72個(gè)RT核心,32個(gè)幾何單元,288個(gè)紋理單元,96個(gè)光柵單元,2通道NVLink”。計(jì)算一下可得,一組SM單元依然是64個(gè)CUDA單元沒變,配備8個(gè)Tensor單元、1個(gè)RT Core,這些沒有疑問。
從GPU架構(gòu)圖上看,一共是6組GPC單元,一組GPC里面又有12個(gè)SM單元。不過泄露的圖片是在太糊,細(xì)節(jié)辨認(rèn)不到,但是我們可以比照上一代的Volta架構(gòu)以及老黃在發(fā)布會(huì)上的所講內(nèi)容大膽推測(cè)一下。
Volta架構(gòu)SM單元內(nèi)部,可點(diǎn)擊放大
首先我們看看SM單元內(nèi)的變化,原本Volta里面是有FP64、INT、FP32、Tensor Core四種單元,但是到了Turing中只剩下三種,那么被砍掉的是FP64雙精度單元,其余的都被保留了。那么新加入RT Core應(yīng)該在哪里,你可以發(fā)現(xiàn),SM單元中多了個(gè)巨大的黃色框框,高度懷疑就是RT Core,其數(shù)量也剛好吻合1 SM單元比1 RT Core比例。
此外,早在發(fā)布會(huì)前也有外媒表示,NVIDIA已經(jīng)對(duì)SM單元共享的L2緩存增大一倍,L1緩存也增大了1.7倍,估計(jì)是為了增強(qiáng)運(yùn)算性能。