Tesla A100果然割了一刀 7nm安培完整版128組SMX單元:再?gòu)?qiáng)20%
今晚NVIDIA發(fā)布了7nm安培GPU,首發(fā)的是Tesla A100加速卡,工藝及架構(gòu)全面升級(jí),很好很強(qiáng)大。不過(guò)有一點(diǎn)大家可能猜到了,6912個(gè)CUDA核心的Tesla A100并不是完整版的,NVIDIA依然在首發(fā)產(chǎn)品了留了一刀。
之前的架構(gòu)解析中,Tesla A100加速卡目前所用的核心有6912個(gè)CUDA核心,算下來(lái)是108組SMX單元,VC網(wǎng)站的結(jié)構(gòu)對(duì)比更加清晰,如下所示:
盡管現(xiàn)在的6912個(gè)CUDA核心相比GV100的5120個(gè)CUDA核心已經(jīng)提升了35%,但它依然不是GA100大核心的完整體,這差不多也是NVIDIA每次發(fā)布新卡的保留節(jié)目了,首發(fā)產(chǎn)品要割一刀。
從官方給出的結(jié)構(gòu)來(lái)看,GA100核心完整版是128組SMX單元,也就是8192個(gè)CUDA核心,比現(xiàn)在差不多要多出15-20%的規(guī)模,后續(xù)的潛力很大。
至于為什么首發(fā)的Tesla A100核心這么保守,可能是NVIDIA希望后續(xù)再出更高端的產(chǎn)品,也有可能跟現(xiàn)在的產(chǎn)品功耗已經(jīng)達(dá)到400W有關(guān),為此頻率都降低到了1400MHz了,比GV100核心的1.5-1.6GHz還要低。
完整版的GA100大核心不知道什么時(shí)候解鎖,后續(xù)優(yōu)化了功耗之后,GA100大核心的性能恐怕要再上一層樓了,big Navi大核心不知道能不能追上了。