黃仁勛稱英偉達(dá)首款安培架構(gòu)GPU A100由臺(tái)積電代工
5月15日消息,英偉達(dá)宣布首款基于Ampere(安培)架構(gòu)的GPU NVIDIA A100已全面投產(chǎn)并已向全球客戶交付。
英偉達(dá)
臺(tái)灣媒體稱,雖然近期市場(chǎng)傳出新款GPU可能由三星晶圓代工搶下訂單,但英偉達(dá)CEO黃仁勛日前證實(shí),Ampere架構(gòu)GPU采用臺(tái)積電客制化7nm先進(jìn)制程,部份高端GPU亦采用臺(tái)積電CoWoS(基板上晶圓上晶片封裝)技術(shù)。
供應(yīng)鏈消息稱,英偉達(dá)第二季度開始大舉拉高7nm Ampere架構(gòu)GPU投片量,預(yù)計(jì)下半年對(duì)7nm產(chǎn)能需求會(huì)更高,臺(tái)積電直接受惠且7nm產(chǎn)能利用率維持滿載。
新款GPU后段封裝主要由日月光投控旗下硅品承接,測(cè)試業(yè)務(wù)則交由京元電負(fù)責(zé),旺硅拿下晶圓探針卡及測(cè)試板訂單,至于GPU封裝用ABF基板供應(yīng)商則包括欣興及景碩。
英偉達(dá)A100 GPU五大關(guān)鍵性創(chuàng)新
英偉達(dá)Ampere架構(gòu)–A100的核心是NVIDIA Ampere GPU架構(gòu),該架構(gòu)包含超過540億個(gè)晶體管,這使其成為全球最大的7納米處理器。
具有TF32的第三代Tensor Core核心 – NVIDIA廣泛采用的Tensor Core核心現(xiàn)在已變得更加靈活、快速且易于使用。其功能經(jīng)過擴(kuò)展后加入了專為AI開發(fā)的全新TF32,它能在無需更改任何代碼的情況下,使FP32精度下的AI性能提高多達(dá)20倍。此外,Tensor Core核心現(xiàn)在支持FP64精度,相比于前代,其為HPC應(yīng)用所提供的計(jì)算力比之前提高了多達(dá)2.5倍。
多實(shí)例GPU – MIG,一種全新技術(shù)功能,可將單個(gè)A100 GPU分割為多達(dá)七個(gè)獨(dú)立的GPU,為不同規(guī)模的工作提供不同的計(jì)算力,以此實(shí)現(xiàn)最佳利用率和投資回報(bào)率的最大化。
第三代英偉達(dá) NVLink –使GPU之間的高速聯(lián)接增加至原來的兩倍,實(shí)現(xiàn)服務(wù)器的高效性能擴(kuò)展。
結(jié)構(gòu)化稀疏–這種全新效率技術(shù)利用AI數(shù)學(xué)固有的稀疏性,使性能提升了一倍。
英偉達(dá)表示,全球眾多云服務(wù)供應(yīng)商和系統(tǒng)構(gòu)建商計(jì)劃將A100 GPU集成到其產(chǎn)品中,其中包括:阿里云、AWS、Atos、百度智能云、思科、Dell Technologies、富士通、技嘉科技、Google Cloud、新華三、HPE、浪潮、聯(lián)想、Microsoft Azure、甲骨文、Quanta/QCT、Supermicro和騰訊云。