141萬元!NVIDIA發(fā)布安培個人超算:八路GPU、雙路AMD 64核心
5月14日晚間,NVIDIA終于發(fā)布了期待已久的全新“安培”(Ampere)架構(gòu),又一個核彈級的GPU芯片,當(dāng)然它面向的不是PC游戲市場,而是人工智能、深度學(xué)習(xí)、高性能計算、大數(shù)據(jù)等等尖端領(lǐng)域。
宣布新架構(gòu)的同時,NVIDIA也發(fā)布了相應(yīng)的第三代工作站“DGX A100”,或者按照NVIDIA的說法叫做個人超級計算機(jī),可以支持在桌面端進(jìn)行AI研究,并擴(kuò)展到云端。
DGX A100內(nèi)部配備了八顆安培架構(gòu)的Tesla A100 GPU,每一顆整合40GB HBM2高帶寬顯存,總?cè)萘窟_(dá)320GB。
每顆GPU均支持多達(dá)12路的NVLink互連總線,GPU-GPU帶寬高達(dá)600GB/s,可保證八顆GPU彼此完全互連,同時還有6顆NVIDIA NVSwitch芯片,雙向帶寬高達(dá)4.8TB/s。
不過從示意圖上可以看出,每顆GPU周圍其實有六顆HBM2顯存芯片,很顯然有一顆沒有啟用,剩下的五顆單顆容量8GB從而組成40GB。這意味著,A100核心現(xiàn)在應(yīng)該也是屏蔽了六分之一的規(guī)模。
網(wǎng)絡(luò)方面配備了剛完成收購的Mellanox的解決方案,包括八顆單端口ConnectX-6 VPI用于聚類,峰值性能200GB/s,以及一顆雙端口ConnectX-6 VPI用于數(shù)據(jù)與存儲網(wǎng)絡(luò)。
有趣的是,搭配的CPU處理器這次拋棄了Intel至強(qiáng),改而使用兩顆AMD二代霄龍(Rome),且是頂級的64核心型號,同時搭配1TB DDR4內(nèi)存、15TB PCIe 4.0 NVMe SSD固態(tài)硬盤。
黃仁勛稱這是“世界上最大的顯卡”,不算外殼單單是其中的計算板加散熱器就有45斤的重量,集成超過3萬個不同組件,鉆孔數(shù)量多達(dá)100萬個,連接電路長達(dá)1公里。
NVIDIA宣稱,DGX A100系統(tǒng)單節(jié)點的峰值性能為:INT8 10 PetaOPS(每秒1億億次整數(shù)運(yùn)算)、FP16 5 PFlops(每秒5千萬億次半精度浮點運(yùn)算)、TF32 2.5 PFlops(每秒2.5千萬億次運(yùn)算)、FP64 156 TFlops(每秒156萬億次雙精度浮點運(yùn)算)。
相比于高端CPU服務(wù)器,它的AI計算性能要高出150倍,內(nèi)存帶寬高出40倍,IO帶寬也高出40倍。
NVIDIA DGX A100個人超算現(xiàn)已上市,售價19.9萬美元,約合人民幣141萬元。
該方案的云服務(wù)客戶有阿里云、亞馬遜AWS、百度云、Google Cloud、微軟Azure、甲骨文、騰訊云,系統(tǒng)級客戶有AtoS、Cray、戴爾、富士通、技嘉、HPE、浪潮、聯(lián)想、廣達(dá)、SuperMicro。