AMD最強(qiáng)AI芯片發(fā)布:性能是英偉達(dá)H100的1.3倍!
12月7日消息,AMD于當(dāng)?shù)貢r(shí)間周三舉行了“Advancing AI”發(fā)布會(huì),正式推出了面向AI及HPC領(lǐng)域的GPU產(chǎn)品Instinct MI300A/MI300X加速器,直接與英偉達(dá)(NVIDIA)H100加速器競(jìng)爭(zhēng)。
同時(shí)AMD還發(fā)布了代號(hào)為Hawk Point的最新一代Ryzen 8000系列APU,可面向AI PC產(chǎn)品。
MI300A:HPC性能達(dá)到NVIDIA H100的4倍
雖然在今年6月的“數(shù)據(jù)中心與人工智能技術(shù)發(fā)布會(huì)”,AMD就有發(fā)布MI300A和MI300X,只不過當(dāng)時(shí)MI300X只是紙面上的發(fā)布,現(xiàn)在MI300A和MI300X已經(jīng)開始批量量產(chǎn)了,AMD也公布了更多關(guān)于MI300A、MI300X的性能數(shù)據(jù)。
AMD MI300A采用了Chiplet設(shè)計(jì),其內(nèi)部擁有多達(dá)13個(gè)小芯片,均基于臺(tái)積電5nm或6nm制程工藝(CPU/GPU計(jì)算核心為5nm,HBM內(nèi)存和I/O等為6nm),其中許多是 3D 堆疊的,以便創(chuàng)建一個(gè)面積可控的單芯片封裝,總共集成1460 億個(gè)晶體管。
具體來說,MI300A與上一代的MI250X一脈相承,采用新一代的CDNA 3 GPU架構(gòu),擁有228個(gè)計(jì)算單元(14592個(gè)核心),并集成了24個(gè)Zen 4 CPU內(nèi)核,配置了128GB的HBM3內(nèi)存。
MI300A的計(jì)算核心被 8 個(gè)HBM3內(nèi)存包圍,單個(gè)HBM3的帶寬為6.3GB/s,八個(gè)16GB堆棧形成128GB統(tǒng)一內(nèi)存,帶寬高達(dá)5.3 TB/s。
在算力方面,MI300A提供了高達(dá)61 TFLOPS FP64算力,多達(dá)122 TFLOPS FP32算力。
AMD表示,MI300A GPU將HPC提升到一個(gè)新的水平,其性能是NVIDIA H100的4倍,能效是H100的兩倍。
具體來說,在OpenFOAM中,MI300A APU提供了相比H100高達(dá)4倍的性能提升,這主要來自于統(tǒng)一的內(nèi)存布局、GPU性能以及整體內(nèi)存容量和帶寬。與NVIDIA的Grace Hopper超級(jí)芯片相比,該系統(tǒng)每瓦的性能也提高了2倍。