NVIDIA CEO:“我們創(chuàng)造了為生成式 AI 時(shí)代而生的處理器”
生成式 AI 有望徹底改變它所觸及的每一個(gè)行業(yè) —— 掌握技術(shù)是迎接挑戰(zhàn)的關(guān)鍵。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛發(fā)布了全新的 Blackwell 計(jì)算平臺(tái),并概述了計(jì)算能力的提升可為軟件、服務(wù)、機(jī)器人技術(shù)、醫(yī)療技術(shù)等各個(gè)方面帶來(lái)的重大進(jìn)步。
“加速計(jì)算已到達(dá)臨界點(diǎn),通用計(jì)算已失去動(dòng)力,”黃仁勛在硅谷巨大的 SAP 中心體育館對(duì)其主題演講觀眾說(shuō)道。GTC 現(xiàn)場(chǎng)聚集了超過(guò) 11,000 名與會(huì)者,在線觀眾數(shù)以萬(wàn)計(jì)。
“我們需要一種全新的計(jì)算方式 —— 由此我們才可以繼續(xù)擴(kuò)展,繼續(xù)降低計(jì)算成本,并在保證可持續(xù)性的同時(shí)繼續(xù)進(jìn)行越來(lái)越多的計(jì)算。與通用計(jì)算相比,加速計(jì)算使每個(gè)行業(yè)都可以大幅提速?!?
黃仁勛站在網(wǎng)球場(chǎng)大小的 40 英尺高 8K 屏幕前,向擠滿了首席執(zhí)行官、開(kāi)發(fā)者、AI 愛(ài)好者和企業(yè)家的人群發(fā)表演講。
為了推動(dòng)世界 AI 基礎(chǔ)設(shè)施實(shí)現(xiàn)大規(guī)模升級(jí)的目標(biāo),黃仁勛發(fā)布了 NVIDIA Blackwell 平臺(tái),該平臺(tái)具有對(duì)萬(wàn)億參數(shù)大語(yǔ)言模型進(jìn)行實(shí)時(shí)生成的能力。
黃仁勛介紹了 NVIDIA 推理微服務(wù),即 NVIDIA NIM。這是一種全新的軟件打包和交付方式,能夠?qū)㈤_(kāi)發(fā)者與數(shù)億個(gè) GPU 連接起來(lái),以部署各種定制 AI。
黃仁勛還介紹了 Omniverse Cloud API,它可以提供先進(jìn)的模擬能力,將 AI 引入物理世界。
演講的尾聲,黃仁勛進(jìn)行了精彩演示,講解了與一些大型企業(yè)的合作伙伴關(guān)系生態(tài),還詳細(xì)介紹了超過(guò)二十項(xiàng)發(fā)布來(lái)闡述其愿景,以此為 GTC 2024 的重磅發(fā)布畫(huà)上了圓滿的句號(hào)。
GTC 大會(huì)已經(jīng)開(kāi)展了 15 年,從最初在一個(gè)本地酒店宴客廳舉辦,到現(xiàn)在發(fā)展成了全球最重要的 AI 大會(huì)。本次大會(huì)是近五年來(lái)首次恢復(fù)線下。
今年的大會(huì)包含超過(guò) 900 場(chǎng)會(huì)議,其中包括由黃仁勛主持的有關(guān) Transformer 的專(zhuān)家討論會(huì),期間將與首批開(kāi)發(fā)該技術(shù)的八位先驅(qū)們對(duì)話。此外,還有超過(guò) 300 個(gè)展示和 20 多個(gè)技術(shù)研討會(huì)。
GTC 是一個(gè)幾乎涉及所有領(lǐng)域的 AI 盛會(huì)。在開(kāi)場(chǎng)致辭中,全球領(lǐng)先的 AI 藝術(shù)家 Refik Anadol 帶來(lái)了驚艷的表演,展示了一座巨大的實(shí)時(shí) AI 數(shù)據(jù)雕塑,屏幕上呈現(xiàn)著綠色、藍(lán)色、黃色和紅色的波動(dòng)狀旋渦,翻騰,交織和散落。
黃仁勛在演講開(kāi)始時(shí)解釋說(shuō),多模態(tài) AI 的崛起——能夠處理由不同模型負(fù)責(zé)的多樣化數(shù)據(jù)類(lèi)型——賦予了 AI 更大的適應(yīng)性和能力。通過(guò)增加參數(shù),這些模型可以處理更復(fù)雜的分析任務(wù)。
但這也意味著對(duì)計(jì)算能力的需求顯著上升。隨著這些協(xié)作、多模態(tài)系統(tǒng)變得更加復(fù)雜(參數(shù)多達(dá)萬(wàn)億),對(duì)先進(jìn)計(jì)算基礎(chǔ)設(shè)施的需求也隨之增加。
“我們需要更大的模型,”黃仁勛表示,“我們將使用多模態(tài)數(shù)據(jù)來(lái)訓(xùn)練它,而不僅僅是互聯(lián)網(wǎng)上的文本。我們將使用文本和圖像、圖形和圖表來(lái)訓(xùn)練它,就像我們從電視中學(xué)習(xí)一樣,它也需要從海量視頻中學(xué)習(xí)?!?
新一代加速計(jì)算
黃仁勛說(shuō):“我們需要更大的 GPU”。 Blackwell 平臺(tái)就是為了應(yīng)對(duì)這一挑戰(zhàn)而構(gòu)建的。他從口袋里掏出一塊 Blackwell 芯片,將它與 Hopper 芯片并排舉起,后者顯得小了一些。
新架構(gòu)以一位加州大學(xué)伯克利分校的數(shù)學(xué)家 David Harold Blackwell 而命名。他專(zhuān)門(mén)研究博弈論和統(tǒng)計(jì)學(xué),也是第一位入選美國(guó)國(guó)家科學(xué)院的黑人學(xué)者。新架構(gòu)超越了兩年前推出的 NVIDIA Hopper 架構(gòu)。
Blackwell 在單芯片訓(xùn)練方面的 FP8 性能是其上一代架構(gòu)的 2.5 倍,在推理方面的 FP4 性能是其上一代架構(gòu)的 5 倍。它具有第五代 NVLink 互連,速度是 Hopper 的兩倍,并且可擴(kuò)展至 576 個(gè) GPU。
NVIDIA GB200 Grace Blackwell 超級(jí)芯片通過(guò) 900GB/s 超低功耗的 NVLink 芯片間互連,將兩個(gè) Blackwell NVIDIA B200 Tensor Core GPU 連接到 NVIDIA Grace CPU。
黃仁勛舉起一塊帶有系統(tǒng)的電路板說(shuō)道:“這臺(tái)計(jì)算機(jī)是同類(lèi)計(jì)算機(jī)中的第一臺(tái),能夠在這么小的空間容納如此多的計(jì)算量。由于它的內(nèi)存是連貫的,感覺(jué)就像一個(gè)幸福的大家庭一起開(kāi)發(fā)一個(gè)應(yīng)用程序。”
為了獲得最高的 AI 性能,基于 GB200 的系統(tǒng)可以與今日發(fā)布的 NVIDIA Quantum-X800 InfiniBand 和 Spectrum-X800 以太網(wǎng)平臺(tái)連接,這些平臺(tái)可提供速度高達(dá) 800Gb/s 的高級(jí)網(wǎng)絡(luò)。
“這樣我們可以大量地節(jié)省能源、網(wǎng)絡(luò)帶寬量和時(shí)間?!秉S仁勛表示,“未來(lái)將是可生成的,這就是為什么這是一個(gè)全新的行業(yè)。我們的計(jì)算方式有本質(zhì)差異,所以 NVIDIA 為生成式 AI 時(shí)代打造了一款全新處理器?!?
為了擴(kuò)大 Blackwell 的規(guī)模,NVIDIA 構(gòu)建了一款名為 NVLink Switch 的新芯片。每個(gè)芯片可以以每秒 1.8 TB 的速度連接四個(gè) NVLink,并通過(guò)減少網(wǎng)絡(luò)內(nèi)流量來(lái)消除流量擁塞。
NVIDIA Switch 和 GB200 是黃仁勛所稱(chēng)的 “一個(gè)巨型 GPU” ,也是 NVIDIA GB200 NVL72 的關(guān)鍵組件。NVIDIA GB200 NVL72 是一種多節(jié)點(diǎn)、液冷、機(jī)架級(jí)系統(tǒng),利用 Blackwell 為萬(wàn)億參數(shù)模型提供強(qiáng)力計(jì)算,在單個(gè)機(jī)架中可實(shí)現(xiàn) 720 petaflops 的 AI 訓(xùn)練性能和 1.4 exaflops 的 AI 推理性能。
該機(jī)器包含 600,000 個(gè)零件,重 3,000 磅。黃仁勛在介紹此臺(tái)機(jī)器時(shí)說(shuō)道:“此時(shí)此刻,地球上也許只有三臺(tái)百億億次浮點(diǎn)運(yùn)算機(jī)器。而這是一個(gè)單一機(jī)架中的1個(gè)百億億次浮點(diǎn)運(yùn)算 AI 系統(tǒng)。”
此外,NVIDIA 還推出了更強(qiáng)大的新一代 AI 超級(jí)計(jì)算機(jī) —— 由 NVIDIA GB200 Grace Blackwell 超級(jí)芯片提供支持的 NVIDIA DGX SuperPOD,可用于處理萬(wàn)億參數(shù)模型,并具有持續(xù)的正常運(yùn)行時(shí)間,以實(shí)現(xiàn)超大規(guī)模生成式 AI 訓(xùn)練和推理工作負(fù)載。
全新 DGX SuperPOD 采用新型高效液冷機(jī)架規(guī)模架構(gòu),采用 NVIDIA DG GB200 系統(tǒng)構(gòu)建,可在 FP4 精度下提供 11.5 exaflops 的 AI 超級(jí)計(jì)算能力和 240 TB 的快速內(nèi)存,并可通過(guò)額外的機(jī)架進(jìn)行擴(kuò)展。
“未來(lái),數(shù)據(jù)中心將成為 AI 工廠”,黃仁勛說(shuō),“AI 工廠的使命是創(chuàng)造收入,同時(shí)也創(chuàng)造智能?!?
Blackwell 已經(jīng)受到了各行各業(yè)的歡迎,并獲得多個(gè)行業(yè)領(lǐng)導(dǎo)者的支持,其中包括Alphabet 及 Google的首席執(zhí)行官 Sundar Pichai,Amazon 首席執(zhí)行官 Andy Jassy,Dell 首席執(zhí)行官 Michael Dell, Google DeepMind 首席執(zhí)行官 Demis Hassabis,Meta 首席執(zhí)行官 Mark Zuckerberg,Microsoft 首席執(zhí)行官 Satya Nadella,OpenAI 首席執(zhí)行官 Sam Altman,Oracle 董事長(zhǎng) Larry Ellison和Tesla和xAI 首席執(zhí)行官Elon Musk。
Blackwell 正在被全球各大云服務(wù)提供商、領(lǐng)先的 AI 公司、系統(tǒng)和服務(wù)器供應(yīng)商,以及世界各地的區(qū)域云服務(wù)提供商和電信公司所采用。
“整個(gè)行業(yè)都在為 Blackwell 做準(zhǔn)備”,黃仁勛表示。
創(chuàng)造軟件的新方式
黃仁勛表示,生成式 AI 改變了應(yīng)用程序的編寫(xiě)方式。
他解釋說(shuō),未來(lái)的公司會(huì)將精力放在組裝 AI 模型,賦予它們?nèi)蝿?wù),給出工作產(chǎn)品示例,審查計(jì)劃和中間結(jié)果,而不是編寫(xiě)軟件。
NVIDIA NIM 軟件包是根據(jù) NVIDIA 的加速計(jì)算庫(kù)和生成式 AI 模型構(gòu)建的。
“未來(lái)我們?nèi)绾螛?gòu)建軟件?你不太可能從頭開(kāi)始編寫(xiě),也不太可能寫(xiě)一大堆 Python 代碼或類(lèi)似的東西,” 黃仁勛說(shuō),“很可能你只需要組建一支 AI 團(tuán)隊(duì)就夠了。”
這些微服務(wù)支持行業(yè)標(biāo)準(zhǔn) API,易于連接,可在 NVIDIA 龐大的 CUDA 安裝基礎(chǔ)上工作,針對(duì)新 GPU 進(jìn)行重新優(yōu)化,并不斷掃描安全漏洞和威脅。
黃仁勛表示,客戶(hù)可以使用現(xiàn)成的 NIM 微服務(wù),或者 NVIDIA 可以為之構(gòu)建專(zhuān)屬的AI 和 AI 助手,為特定公司所需的模型專(zhuān)業(yè)技能提供專(zhuān)門(mén)訓(xùn)練,以助力您創(chuàng)建寶貴的新服務(wù)。
“企業(yè)IT行業(yè)正坐在一座‘金礦’上,”黃仁勛說(shuō)道, “他們擁有多年來(lái)創(chuàng)建的所有這些令人驚嘆的工具(和數(shù)據(jù))。如果他們能把這個(gè)‘金礦’變成 AI 助手,就能給用戶(hù)提供更多可能?!?
領(lǐng)先的科技公司已經(jīng)開(kāi)始行動(dòng)。黃仁勛詳細(xì)介紹了 NVIDIA 如何幫助 Cohesity、NetApp、SAP、ServiceNow 和 Snowflake 構(gòu)建 AI 助手和虛擬助理。各行各業(yè)也在紛紛加入行列。
在電信領(lǐng)域,黃仁勛宣布推出 NVIDIA 6G 研究云,這是一個(gè)由 AI 和 Omniverse 支持的生成平臺(tái),旨在推動(dòng)下一個(gè)通信時(shí)代的發(fā)展。它采用 NVIDIA 的 Sionna 神經(jīng)無(wú)線電框架、NVIDIA Aerial CUDA 加速無(wú)線電接入網(wǎng)絡(luò)和 NVIDIA Aerial Omniverse Digital Twin for 6G 構(gòu)建。
在半導(dǎo)體設(shè)計(jì)和制造領(lǐng)域,黃仁勛宣布,NVIDIA 正在與 TSMC 和 Synopsys 合作,將其突破性的計(jì)算光刻平臺(tái) cuLitho 投入生產(chǎn)。該平臺(tái)將把半導(dǎo)體制造中計(jì)算最密集的工作負(fù)載加速 40-60 倍。
黃仁勛還宣布了 NVIDIA 地球氣候數(shù)字孿生。該云平臺(tái)現(xiàn)已推出,可實(shí)現(xiàn)交互式高分辨率模擬,以加速氣候和天氣預(yù)報(bào)。
黃仁勛表示,AI 的最大影響將體現(xiàn)在醫(yī)療領(lǐng)域,NVIDIA 已經(jīng)涉足成像系統(tǒng)、基因測(cè)序儀器,并與領(lǐng)先的手術(shù)機(jī)器人公司合作。
NVIDIA 正在推出一種新型生物學(xué)軟件。 NVIDIA 今天發(fā)布了二十多個(gè)新的微服務(wù),使全球醫(yī)療企業(yè)能夠在任何地方、任何云上利用生成式 AI 的最新進(jìn)展。這些微服務(wù)可提供先進(jìn)的成像、自然語(yǔ)言和語(yǔ)音識(shí)別,以及數(shù)字生物學(xué)生成、預(yù)測(cè)和模擬功能。
Omniverse 將 AI 引入物理世界
下一波 AI 浪潮將是 AI 對(duì)物理世界的學(xué)習(xí),黃仁勛說(shuō)道。
黃仁勛表示:“我們需要一個(gè)模擬引擎,來(lái)以數(shù)字方式為機(jī)器人呈現(xiàn)世界,這樣機(jī)器人就有了一個(gè)學(xué)習(xí)如何成為機(jī)器人的‘健身房’,我們稱(chēng)這個(gè)虛擬世界為 Omniverse?!?
因此,NVIDIA 宣布將以 API 形式提供 NVIDIA Omniverse Cloud,從而將全球領(lǐng)先的工業(yè)數(shù)字孿生應(yīng)用和工作流創(chuàng)建平臺(tái)的覆蓋范圍擴(kuò)展到整個(gè)軟件制造商生態(tài)系統(tǒng)。
借助五個(gè)全新 Omniverse Cloud 應(yīng)用編程接口(API),開(kāi)發(fā)者能夠輕松地將 Omniverse 的核心技術(shù)直接集成到現(xiàn)有的數(shù)字孿生設(shè)計(jì)與自動(dòng)化軟件應(yīng)用中,或是集成到用于測(cè)試和驗(yàn)證機(jī)器人或自動(dòng)駕駛汽車(chē)等自主機(jī)器的仿真工作流中。
為了展示其工作原理,黃仁勛分享了一個(gè)機(jī)器人倉(cāng)庫(kù)的演示——使用多攝像頭感知和追蹤,看顧工人并協(xié)調(diào)機(jī)器人叉車(chē),在整個(gè)機(jī)器人堆棧運(yùn)行的情況下,這些叉車(chē)能夠?qū)崿F(xiàn)自動(dòng)駕駛。
黃仁勛還宣布,NVIDIA 將把 Omniverse 引入 Apple Vision Pro 中,通過(guò)新的 Omniverse Cloud API,開(kāi)發(fā)者可以將交互式工業(yè)數(shù)字孿生流式傳輸?shù)?VR 頭顯中。
一些全球大型工業(yè)軟件制造商正在采用 Omniverse Cloud API,包括 Ansys、Cadence、達(dá)索系統(tǒng)旗下 3DEXCITE 品牌、Hexagon、微軟、羅克韋爾自動(dòng)化、西門(mén)子和 Trimble 等。
機(jī)器人技術(shù)
黃仁勛表示:“所有會(huì)動(dòng)的東西都可能成為機(jī)器人,汽車(chē)行業(yè)將是其中的一個(gè)重要部分,NVIDIA 的計(jì)算平臺(tái)已經(jīng)應(yīng)用在乘用車(chē)、卡車(chē)、配送機(jī)器人和自動(dòng)駕駛出租車(chē)中?!?
黃仁勛宣布,世界上最大的自動(dòng)駕駛汽車(chē)公司比亞迪已選擇 NVIDIA 的下一代計(jì)算平臺(tái)用于其自動(dòng)駕駛汽車(chē),在 DRIVE Thor 上構(gòu)建其下一代電動(dòng)汽車(chē)車(chē)隊(duì)。
為了幫助機(jī)器人更好地感知所處環(huán)境,黃仁勛還發(fā)布了 Isaac Perceptor 軟件開(kāi)發(fā)工具包,該工具包具有最先進(jìn)的多攝像頭視覺(jué)里程計(jì)、3D 重建和占用地圖,以及深度感知功能。
為了使機(jī)械臂更具適應(yīng)性,NVIDIA 宣布推出 Isaac Manipulator —— 一個(gè)先進(jìn)的機(jī)械臂感知、路徑規(guī)劃和運(yùn)動(dòng)學(xué)控制庫(kù)。
最后,黃仁勛宣布了 Project GR00T,這是一個(gè)為人形機(jī)器人設(shè)計(jì)的通用基礎(chǔ)模型,旨在進(jìn)一步推動(dòng) NVIDIA 在機(jī)器人技術(shù)和具身智能方面的突破性工作。
為了支持這一努力,黃仁勛推出了一款用于人形機(jī)器人的新型計(jì)算機(jī) Jetson Thor,它基于 NVIDIA Thor 系統(tǒng)級(jí)芯片,并對(duì) NVIDIA Isaac 機(jī)器人平臺(tái)進(jìn)行了重大升級(jí)。
演講接近尾聲之時(shí),黃仁勛展示了來(lái)自迪士尼研究院的一對(duì)由 NVIDIA 驅(qū)動(dòng)的小型機(jī)器人。
黃仁勛表示:“計(jì)算機(jī)圖形學(xué)、物理學(xué)和AI 是 NVIDIA 的靈魂所在,生成式 AI 時(shí)代一切改變都有可能發(fā)生。”