安培大核心火了:中國八大巨頭集體擁抱NVIDIA A100
NVIDIA今天在GTC大會(huì)上宣布,多家中國頂級(jí)云服務(wù)提供商、系統(tǒng)制造商都部署了NVIDIA A100 Tensor Core GPU、NVIDIA技術(shù),為各種AI應(yīng)用提速。
今年5月,NVIDIA推出了首款基于安培架構(gòu)的A100 GPU,臺(tái)積電7nm工藝制造,集成多達(dá)542億個(gè)晶體管,核心面積達(dá)826平方毫米,內(nèi)置6912個(gè)FP32 CUDA核心,最高加速頻率1.4GHz,搭配512-bit 40GB HBM2顯存,帶寬達(dá)1.6TB/s。
相比上代伏特架構(gòu)的V100核心,它的INT8推理、FP32訓(xùn)練性能提升20倍,F(xiàn)P64計(jì)算性能提升2.5倍,是歷史上進(jìn)步最大的一次。
A100 GPU還配備了精度更高的第三代Tensor Core張量核心、GPU間傳輸率高達(dá)600GB/s的第三代NVIDIA NVLink、NVIDIA NVSwitch、PCIe 4.0、NVIDIA Magnum IO軟件SDK,可實(shí)現(xiàn)成千上萬個(gè)GPU集群的高效擴(kuò)展。
部署A100的中國云服務(wù)商有:
- 阿里云
已發(fā)布gn7 GPU系列云服務(wù)器,內(nèi)置8塊A100,主要面向AI訓(xùn)練和高性能計(jì)算應(yīng)用,可提供新一代GPU計(jì)算實(shí)例,相比上一代平臺(tái)AI性能提升最高20倍,高性能計(jì)算提升2.5倍。
- 百度智能云
即將推出lgn3 GPU系列云服務(wù)器、vGPU云服務(wù)器、百度太行裸金屬服務(wù)器。
最多搭載8塊A100 GPU、8TB NVMe SSD、數(shù)百G帶寬,主要面向AI訓(xùn)練/推理、高性能計(jì)算應(yīng)用、科學(xué)計(jì)算等場(chǎng)景,計(jì)算能力20倍于上代V100。
- 滴滴云
A100裸金屬服務(wù)器,配置8塊A100 GPU、2顆AMD EPYC 7302處理器、1024GB內(nèi)存、2個(gè)240GB SATA SSD、2個(gè)2TB NVME SSD,適用于AI、數(shù)據(jù)分析、高性能計(jì)算等多種應(yīng)用場(chǎng)景。
- 騰訊云
已推出云服務(wù)器GT4,搭配AMD第二代霄龍平臺(tái),最高180核心vGPU,適用于深度學(xué)習(xí)訓(xùn)練、推理、高性能計(jì)算、數(shù)據(jù)分析、視頻分析等領(lǐng)域。
部署A100的中國OEM廠商有:
- 新華三
已推出搭載8顆A100 GPU的全互聯(lián)6U服務(wù)器H3C UniServer R5500 G5,同時(shí)全線GPU服務(wù)器機(jī)型已同步適配升級(jí),包括H3C UniServer R4900 G3(2U 3GPU)、R5300 G3(4U 8GPU)、R4950 G5(2U 4GPU),部分機(jī)型已完成NVQUAL認(rèn)證,全面覆蓋集群建設(shè)、大規(guī)模AI模型訓(xùn)練、高性能計(jì)算、AI項(xiàng)目部署等應(yīng)用場(chǎng)景。
- 浪潮
已發(fā)布發(fā)布多款支持A100 40G的AI服務(wù)器,可配置8-16顆,包括NF5488M5-D、NF5488A5、 NF5688M6、NF5888M6,還推出了三款支持A100 PCIe版本的服務(wù)器NF5468M6、NF5468A5、NF5280M6。
配備最新A100 80GB GPU的AI服務(wù)器NF5488M5-D、NF5488A5也已全球量產(chǎn)供貨。
- 聯(lián)想
推出了配備A100 GPU的HG680X,4U 8GPU規(guī)格,可滿足單機(jī)多卡需求,支持兩種拓?fù)湫问?,存?chǔ)支持最多8個(gè)NVMe SSD加16個(gè)2.5英寸SAS/SSD,或者24個(gè)2.5英寸SAS/SSD。
適用于大型深度學(xué)習(xí)模型訓(xùn)練場(chǎng)景、大量數(shù)據(jù)的推理場(chǎng)景,適應(yīng)不同深度學(xué)習(xí)算法與改進(jìn),可滿足互聯(lián)網(wǎng)、金融、制造等不同行業(yè)客戶的多樣化需求。
- 寧暢
X640 G30 GPU服務(wù)器完成8卡A100的適配,并通過了NVIDIA NVQUAL的官方認(rèn)證,可針對(duì)不同場(chǎng)景進(jìn)行GPU互聯(lián)拓?fù)湔{(diào)整、升級(jí)算力?,F(xiàn)已在客戶處完成批量部署,應(yīng)用于海量數(shù)據(jù)訓(xùn)練、深度學(xué)習(xí)、語音識(shí)別、圖像識(shí)別等領(lǐng)域。