英偉達(dá)又發(fā)一款圖靈架構(gòu)顯卡Tesla T4,TDP功耗只有75W
NVIDIA的圖靈架構(gòu)發(fā)布以來已經(jīng)有六款顯卡問世了,包括專業(yè)級(jí)的RTX 8000/6000/5000及消費(fèi)級(jí)的RTX 2080 Ti/2080/2070顯卡。今天NVIDIA在日本GTC大會(huì)上又宣布了一款圖靈架構(gòu)的新卡——Tesla T4,有2560個(gè)CUDA核心,集成320個(gè)Tensor Core核心,F(xiàn)P32浮點(diǎn)性能8.1TFLOPS,INT4浮點(diǎn)性能最高260TFLOPS,更神奇的是這款顯卡只有75W TDP,在規(guī)模比RTX 2070顯卡還高的情況下TDP功耗低得多。
這次發(fā)布的Tesla T4顯卡主要面向AI推理應(yīng)用,使用了PCIe插槽,被動(dòng)散熱設(shè)計(jì),外觀風(fēng)格跟RTX 8000及RTX 2080 Ti顯卡又不是一種風(fēng)格了,看圖片更有金屬質(zhì)感。
雖然Tesla系列的專業(yè)卡跟普通消費(fèi)者關(guān)系不大,不過Tesla T4的意義在于它不同于現(xiàn)有的幾款圖靈顯卡,CUDA核心數(shù)為2560個(gè),高于RTX 2070顯卡的2304個(gè),低于RTX 2080顯卡的2944個(gè),考慮到后兩款顯卡使用的分別是TU104、TU106核心,Tesla T4顯卡很可能是基于完整版TU106核心的(更正:讀者提醒后者應(yīng)該是閹割版TU104核心),集成了320個(gè)Tensor核心,但沒有提到RT Core。
性能方面,Tesla T4的FP32浮點(diǎn)性能8.1 TFLOPS,F(xiàn)P16性能65TFLOPS,INT8、IN4性能分別是130、260TFLOPS。
顯存方面,Tesla T4配備了16GB GDDR6顯存,但是官方的給出的帶寬又只有320GB/s,如果是256bit位寬,那么320GB/s對(duì)應(yīng)的頻率就是10Gbps,頻率明顯比GDDR6顯存要低,所以這個(gè)卡要么顯存位寬有所降低,要么就是使用了低頻版GDDR6。
最神奇的是顯卡的TDP功耗只有75W,在CUDA核心數(shù)比RTX 2070顯卡2304個(gè)CUDA核心更多的情況下,TDP功耗低了100W,通常這意味著GPU核心頻率大降,但8.1TFLOPS的性能又不太可能比RTX 2070低,種種意外之處都透露著這款顯卡的圖靈核心有點(diǎn)不不尋常。
如果不是面向?qū)I(yè)卡市場(chǎng)的話,這個(gè)圖靈核心其實(shí)更合適做游戲卡,前提是放棄光線追蹤技術(shù)。