英偉達(dá)八代GPU安培架構(gòu)超越前一代圖靈架構(gòu),性能提升高達(dá)20倍
GPU又稱圖形處理器,也被稱為顯卡的“心臟”,相當(dāng)于CPU在電腦中的使用,決定著顯卡的檔次和大部分性能,在現(xiàn)代計(jì)算機(jī)中(特別是家用系統(tǒng)、游戲發(fā)燒友)圖形的處理發(fā)揮著至關(guān)重要的作用。
而近日,英偉達(dá) CEO 黃仁勛正式發(fā)布了新一代 GPU 架構(gòu) Ampere 安培,這是英偉達(dá)推出的第八代 GPU 架構(gòu),較前一代 2018 年發(fā)布的圖靈架構(gòu)性能提升高達(dá) 20 倍。據(jù)悉,英偉達(dá)每代顯卡架構(gòu)均以頂級科學(xué)家命名,這一次以法國物理學(xué)家安培命名。
基于安培架構(gòu),A100 GPU 包含超過 540 億個晶體管,使其成為世界上最大的 7 納米處理器,并搭配 HBM2 顯存,面積 826 平方毫米,60GB/s NV LINK,現(xiàn)已全面投入生產(chǎn)并交付全球客戶。據(jù)黃仁勛表示,這顆芯片采用 7 納米臺積電工藝,540 億晶體管,比上一代架構(gòu),實(shí)現(xiàn) 5 大技術(shù)創(chuàng)新?!斑@是英偉達(dá)八代 GPU 史上最大的一次性能飛躍?!?
根據(jù)英偉達(dá)的官方信息顯示,這次安培架構(gòu) GPU 具有 5 大技術(shù)創(chuàng)新:
1、全新安培 GPU 架構(gòu),540 億晶體管,世界上最大的 7 納米處理器。
2、第三代 Tensor Core AI 核心,支持 TF32 運(yùn)算,無需任何代碼改變就可以讓 AI 性能提升 20 倍,還支持 FP64 雙精度運(yùn)算,與 HPC 應(yīng)用相比帶來了 2.5 倍的性能。
3、 Multi-instance GPU 多實(shí)例 GPU:簡稱 MIG,這是一項(xiàng)創(chuàng)新技術(shù),可以將一個 GPU 劃分為七個獨(dú)立的 GPU,針對不同的目標(biāo)提供不同的運(yùn)算,最大化提高計(jì)算效率。
4、 NVLink 3.0:新一代 GPU 總線的性能翻倍,可以在服務(wù)器應(yīng)用中提供更有效的性能擴(kuò)展。
5、結(jié)構(gòu)稀疏性:這項(xiàng)新技術(shù)利用了 AI 運(yùn)算中固有的稀疏性實(shí)現(xiàn)了性能翻倍。
同時,黃仁勛還帶來了基于安培架構(gòu) GPU A100 的 DGX-A100 AI 系統(tǒng)和面向邊緣 AI 計(jì)算的 EGX A100。有 8 路 Tesla A100 加速卡,性能高達(dá) 5PFLOPS,阿里云、AWS 云、谷歌云、微軟 Azure、甲骨文及騰訊云都將推出基于 DGX A100 的云服務(wù)。
英偉達(dá)在過去 5 年里成功打造了價值 30 億美元的業(yè)務(wù),為人工智能處理提供新解決方案的思路也吸引到競爭對手和初創(chuàng)公司的注意。英偉達(dá)曾是最大的個人電腦游戲顯卡制造商,已將其技術(shù)應(yīng)用于人工智能。英偉達(dá)的產(chǎn)品展示了并行處理數(shù)據(jù)系統(tǒng)的價值,使得從互聯(lián)世界中提取海量信息的模式成為可能。Ampere 芯片已經(jīng)是英偉達(dá)所提供服務(wù)器的一部分。該公司稱這種服務(wù)器有能力取代體積更大、價格更高、耗電量更大的基于英特爾芯片的服務(wù)器。
據(jù)了解,英偉達(dá)和其競爭對手正在搶奪亞馬遜、谷歌以及微軟等提供云計(jì)算服務(wù)的大客戶。黃仁勛表示,所有主要的云服務(wù)提供商都已經(jīng)采用了內(nèi)置 Ampere 芯片的服務(wù)器。