英偉達核彈GPU發(fā)布：4nm工藝還有144核Grace CPU

時間：2022-03-30 12:50:01

關(guān)鍵字：英偉達 GPU 4nm工藝 Grace CPU

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]3月23日消息，當?shù)貢r間22日，圖形處理器大廠英偉達(NVIDIA)的2022年度GTC大會正式開幕，英偉達CEO黃仁勛在主題演講環(huán)節(jié)正式發(fā)布針對數(shù)據(jù)中心的新一代Hopper架構(gòu)的GPU芯片NVIDIA H100，同時發(fā)布的還有基于新核心的加速計算卡“H100”、AI計算系統(tǒng)“DGX H100”。此外還有英偉達自研的服務器處理器Grace CPU。全新Hopper架構(gòu)H100 GPU：臺積電4nm工藝，800億個晶體管。

3月23日消息，當?shù)貢r間22日，圖形處理器大廠英偉達(NVIDIA)的2022年度GTC大會正式開幕，英偉達CEO黃仁勛在主題演講環(huán)節(jié)正式發(fā)布針對數(shù)據(jù)中心的新一代Hopper架構(gòu)的GPU芯片NVIDIA H100，同時發(fā)布的還有基于新核心的加速計算卡“H100”、AI計算系統(tǒng)“DGX H100”。此外還有英偉達自研的服務器處理器Grace CPU。全新Hopper架構(gòu)H100 GPU：臺積電4nm工藝，800億個晶體管。

據(jù)介紹，NVIDIA H100采用了臺積電最新的4nm工藝，而且是定制版，CoWoS 2.5D晶圓級封裝，單芯片設計，集成多達800億個晶體管(比上一代A100多了260億個)，號稱世界上最先進的芯片。H100完整版有8組GPC(圖形處理器集群)、72組TPC(紋理處理器集群)、144組SM(流式多處理器單元)，而每組SM有128個FP32 CUDA核心，總計18432個核心。顯存支持六顆HBM3或者HBM2e，控制器是12組512-bit，總計位寬6144-bit。Tensor張量核心來到第四代，共有576個，另有60MB二級緩存。擴展互連支持PCIe 5.0、NVLink第四代，后者帶寬提升至900GB/s，七倍于PCIe 5.0，相比A100也多了一半。整卡對外總帶寬4.9TB/s。性能方面，F(xiàn)P64/FP32 60TFlops(每秒60萬億次)，F(xiàn)P16 2000TFlops(每秒2000萬億次)，TF32 1000TFlops(每秒1000萬億次)，都三倍于A100，F(xiàn)P8 4000TFlops(每秒4000萬億次)，六倍于A100。內(nèi)核數(shù)量則飆到了前所未有的16896個，達到上一代A100卡的2.5倍。浮點計算和張量核心運算能力也隨之翻了至少3倍，比如FP32就達到了達到60萬億次/秒。不過它的功耗也達到了驚人的700W。英偉達強調(diào)，基于全新Hopper 架構(gòu)的H100 GPU 為加速大規(guī)模AI 及高效能運算樹立了新標準，并帶來六項突破性創(chuàng)新。NVIDIA 正與頂尖的高效能運算、超級運算、超大規(guī)模與云端客戶就 Grace CPU 超級芯片展開合作。Grace CPU 超級芯片與 Grace Hopper 超級芯片預計將于 2023 年上半年上市。

NVIDIA公司(納斯達克代碼：NVDA)是全球可編程圖形處理技術(shù)領袖。與ATI(后被AMD收購)齊名，專注于打造能夠增強個人和專業(yè)計算平臺的人機交互體驗的產(chǎn)品。公司的圖形和通信處理器擁有廣泛的市場，已被多種多樣的計算平臺采用，包括個人數(shù)字媒體PC、商用PC、專業(yè)工作站、數(shù)字內(nèi)容創(chuàng)建系統(tǒng)、筆記本電腦、軍用導航系統(tǒng)和視頻游戲控制臺等。NVIDIA全球雇員數(shù)量超過4000人。全球各地眾多OEM廠商、顯卡制造商、系統(tǒng)制造商、消費類電子產(chǎn)品公司都選擇NVIDIA的處理器作為其娛樂和商用解決方案的核心組件。在PC應用領域(例如制造、科研、電子商務、娛樂和教育等)，NVIDIA公司獲獎不斷的圖形處理器可以提供出色的性能和鮮銳的視覺效果。其媒體和通信處理器能夠執(zhí)行寬帶連接和通信應用中要求十分苛刻的多媒體處理任務，并在音頻應用能力方面取得突破。NVIDIA產(chǎn)品和技術(shù)的基礎是NVIDIA ForceWare，這是一種綜合性軟件套件，能夠?qū)崿F(xiàn)業(yè)內(nèi)領先的圖形、音頻、視頻、通信、存儲和安全功能。NVIDIA ForceWare可以提高采用NVIDIA GeForce圖形芯片和NVIDIA nForce平臺解決方案的各類臺式和移動PC的工作效率、穩(wěn)定性和功能。

基于CPU、GPU兩大新品，英偉達在數(shù)據(jù)中心的計算架構(gòu)得以完整呈現(xiàn)。目前，在服務器CPU領域，市場仍為英特爾、AMD的x86新品所支配。而黃仁勛表示，Grace CPU面向高性能計算細分市場，如科學計算、數(shù)據(jù)分析等。在云計算、企業(yè)級計算、邊緣計算、工作站、個人電腦領域仍以現(xiàn)有CPU為主。發(fā)布會上，黃仁勛還提出基于Hopper架構(gòu)GPU和Grace CPU的“AI工廠”構(gòu)想，并稱為數(shù)據(jù)中心的變革方向：企業(yè)以工業(yè)化規(guī)模提高數(shù)據(jù)中心AI算力，持續(xù)提煉數(shù)據(jù)，進行訓練和完善AI模型，實現(xiàn)AI能力大規(guī)模輸出。

在近日的GTC大會，黃仁勛稱Grace 進展飛速，有望明年供貨。不止于此，老黃將“搭積木”技術(shù)繼續(xù)應用在了Grace技術(shù)上。通過Grace與Hopper連接，英偉達打造了單一超級芯片模組Grace-Hopper.黃仁勛稱Grace-Hopper 的關(guān)鍵驅(qū)動技術(shù)之一是內(nèi)存一致性芯片之間的 NVLink 互連，每個鏈路的速度達 900 GB/s.Grace CPU 也可以是由兩個通過芯片之間的 NVLink 連接、保證一致性的 CPU 芯片組成的超級芯片，可擁有144個CPU核心，內(nèi)存帶寬高達 1 TB/s。