英偉達核彈GPU發(fā)布:4nm工藝還有144核Grace CPU
3月23日消息,當?shù)貢r間22日,圖形處理器大廠英偉達(NVIDIA)的2022年度GTC大會正式開幕,英偉達CEO黃仁勛在主題演講環(huán)節(jié)正式發(fā)布針對數(shù)據(jù)中心的新一代Hopper架構的GPU芯片NVIDIA H100,同時發(fā)布的還有基于新核心的加速計算卡“H100”、AI計算系統(tǒng)“DGX H100”。此外還有英偉達自研的服務器處理器Grace CPU。全新Hopper架構H100 GPU:臺積電4nm工藝,800億個晶體管。
據(jù)介紹,NVIDIA H100采用了臺積電最新的4nm工藝,而且是定制版,CoWoS 2.5D晶圓級封裝,單芯片設計,集成多達800億個晶體管(比上一代A100多了260億個),號稱世界上最先進的芯片。H100完整版有8組GPC(圖形處理器集群)、72組TPC(紋理處理器集群)、144組SM(流式多處理器單元),而每組SM有128個FP32 CUDA核心,總計18432個核心。顯存支持六顆HBM3或者HBM2e,控制器是12組512-bit,總計位寬6144-bit。Tensor張量核心來到第四代,共有576個,另有60MB二級緩存。擴展互連支持PCIe 5.0、NVLink第四代,后者帶寬提升至900GB/s,七倍于PCIe 5.0,相比A100也多了一半。整卡對外總帶寬4.9TB/s。性能方面,F(xiàn)P64/FP32 60TFlops(每秒60萬億次),F(xiàn)P16 2000TFlops(每秒2000萬億次),TF32 1000TFlops(每秒1000萬億次),都三倍于A100,F(xiàn)P8 4000TFlops(每秒4000萬億次),六倍于A100。內核數(shù)量則飆到了前所未有的16896個,達到上一代A100卡的2.5倍。浮點計算和張量核心運算能力也隨之翻了至少3倍,比如FP32就達到了達到60萬億次/秒。不過它的功耗也達到了驚人的700W。英偉達強調,基于全新Hopper 架構的H100 GPU 為加速大規(guī)模AI 及高效能運算樹立了新標準,并帶來六項突破性創(chuàng)新。NVIDIA 正與頂尖的高效能運算、超級運算、超大規(guī)模與云端客戶就 Grace CPU 超級芯片展開合作。Grace CPU 超級芯片與 Grace Hopper 超級芯片預計將于 2023 年上半年上市。
NVIDIA公司(納斯達克代碼:NVDA)是全球可編程圖形處理技術領袖。與ATI(后被AMD收購)齊名,專注于打造能夠增強個人和專業(yè)計算平臺的人機交互體驗的產品。公司的圖形和通信處理器擁有廣泛的市場,已被多種多樣的計算平臺采用,包括個人數(shù)字媒體PC、商用PC、專業(yè)工作站、數(shù)字內容創(chuàng)建系統(tǒng)、筆記本電腦、軍用導航系統(tǒng)和視頻游戲控制臺等。NVIDIA全球雇員數(shù)量超過4000人。全球各地眾多OEM廠商、顯卡制造商、系統(tǒng)制造商、消費類電子產品公司都選擇NVIDIA的處理器作為其娛樂和商用解決方案的核心組件。在PC應用領域(例如制造、科研、電子商務、娛樂和教育等),NVIDIA公司獲獎不斷的圖形處理器可以提供出色的性能和鮮銳的視覺效果。其媒體和通信處理器能夠執(zhí)行寬帶連接和通信應用中要求十分苛刻的多媒體處理任務,并在音頻應用能力方面取得突破。NVIDIA產品和技術的基礎是NVIDIA ForceWare,這是一種綜合性軟件套件,能夠實現(xiàn)業(yè)內領先的圖形、音頻、視頻、通信、存儲和安全功能。NVIDIA ForceWare可以提高采用NVIDIA GeForce圖形芯片和NVIDIA nForce平臺解決方案的各類臺式和移動PC的工作效率、穩(wěn)定性和功能。
基于CPU、GPU兩大新品,英偉達在數(shù)據(jù)中心的計算架構得以完整呈現(xiàn)。目前,在服務器CPU領域,市場仍為英特爾、AMD的x86新品所支配。而黃仁勛表示,Grace CPU面向高性能計算細分市場,如科學計算、數(shù)據(jù)分析等。在云計算、企業(yè)級計算、邊緣計算、工作站、個人電腦領域仍以現(xiàn)有CPU為主。發(fā)布會上,黃仁勛還提出基于Hopper架構GPU和Grace CPU的“AI工廠”構想,并稱為數(shù)據(jù)中心的變革方向:企業(yè)以工業(yè)化規(guī)模提高數(shù)據(jù)中心AI算力,持續(xù)提煉數(shù)據(jù),進行訓練和完善AI模型,實現(xiàn)AI能力大規(guī)模輸出。
在近日的GTC大會,黃仁勛稱Grace 進展飛速,有望明年供貨。不止于此,老黃將“搭積木”技術繼續(xù)應用在了Grace技術上。通過Grace與Hopper連接,英偉達打造了單一超級芯片模組Grace-Hopper.黃仁勛稱Grace-Hopper 的關鍵驅動技術之一是內存一致性芯片之間的 NVLink 互連,每個鏈路的速度達 900 GB/s.Grace CPU 也可以是由兩個通過芯片之間的 NVLink 連接、保證一致性的 CPU 芯片組成的超級芯片,可擁有144個CPU核心,內存帶寬高達 1 TB/s。