NVIDIA發(fā)布7nm安培:540億晶體管核彈、GPU史上最大性能飛躍
5月14日晚,在GTC 2020線上發(fā)布會上,NVIDIA干脆利落地在幾分鐘內(nèi)就放出了老黃的演講視頻,正式推出了安培(Ampere)架構GPU,7nm工藝,540億晶體管,20倍AI算力,5大技術創(chuàng)新,總之新核彈來了。
目前NVIDIA還沒有正式公開安培GPU的詳細架構細節(jié),但是跟上次的圖靈GPU一樣,黃仁勛表示這是NVIDIA八代GPU史上最大的一次性能飛躍。
首款基于安培GPU的產(chǎn)品是Tesla A100加速卡,根據(jù)NVIDIA所說,它帶來了5大技術創(chuàng)新:
1、 全新安培GPU架構,540億晶體管,世界上最大的7nm處理器。
2、 第三代Tensor Core AI核心,支持TF32運算,無需任何代碼改變就可以讓AI性能提升20倍,還支持FP64雙精度運算,與HPC應用相比帶來了2.5倍的性能。
3、 Multi-instance GPU多實例GPU:簡稱MIG,這是一項創(chuàng)新技術,可以將一個GPU劃分為七個獨立的GPU,針對不同的目標提供不同的運算,最大化提高計算效率。
4、 NVLink 3.0:新一代GPU總線的性能翻倍,可以在服務器應用中提供更有效的性能擴展。
5、 結(jié)構稀疏性:這項新技術利用了AI運算中固有的稀疏性實現(xiàn)了性能翻倍。
這5大技術創(chuàng)新使得Tesla A100加速卡成為苛刻工作負載的理想選擇,不僅可以用于AI推理、AI訓練,還可以用于科學仿真、AI對話、基因組、高性能數(shù)據(jù)分析、地震建模及財務計算等等。
與此同時,NVIDIA還宣布了基于Tesla A100的DGX A100超算,有8路Tesla A100加速卡,性能高達5PFLOPS,阿里云、AWS云、谷歌云、微軟Azure、甲骨文及騰訊云都將推出基于DGX A100的云服務。
目前DGX A100發(fā)布之后就立即上市了,跟當年的Tesla V100完全不同,美國、德國的多個實驗室及超算中心已經(jīng)開始使用Tesla A100作為超算解決方案了。
PS:今晚的視頻中,老黃的頭發(fā)已經(jīng)白了一半,作為目前全球最強GPU的掌門人,7nm安培GPU顯然花費了NV公司不少心血,目前揭開的還只是計算方面的,RTX游戲卡還沒公布多少信息。
延伸閱讀:
7nm安培GPU詳解:400W功耗、40GB HBM2、826mm2怪獸出爐
Tesla A100果然割了一刀 7nm安培完整版128組SMX單元:再強20%
141萬元!NVIDIA發(fā)布安培個人超算:八路GPU、雙路AMD 64核心