黃仁勛的“廚房演講”,熬制的卻是英偉達(dá) GPU 史上最大性能飛躍
第一次,在自家的廚房里,英偉達(dá)創(chuàng)始人兼 CEO 黃仁勛開始了 GTC 2020 的演講。
「未來十年,數(shù)據(jù)中心的規(guī)模計(jì)算將成為標(biāo)準(zhǔn)?!拐f完,老黃從自家的烤箱里拿出了全新的安培(Ampere)架構(gòu) GPU,7nm 工藝,540 億晶體管,20 倍 AI 算力的提升。
每次帶來全新架構(gòu),都必然是一次「性能躍遷」。只是這次它不是開啟了一個(gè)全新的大門,而是作為最后一塊磚,補(bǔ)齊了英偉達(dá)在數(shù)據(jù)科學(xué)與 AI 應(yīng)用上的完整版圖。
去年的 GTC2019,黃教主罕見的沒有放出「重磅核彈」傳言中的下一代 7nm 產(chǎn)品以及新架構(gòu)也并沒有出現(xiàn),而更加強(qiáng)調(diào)「生態(tài)」優(yōu)勢(shì)與「落地」的英偉達(dá)卻仿佛要從側(cè)翼用「軟件生態(tài)」構(gòu)筑起一道護(hù)城河。
在高性能計(jì)算之下,收購「絕配」的高性能網(wǎng)絡(luò)公司 Mellanox 和 Cumulus Networks,借助這兩個(gè)公司組成的新業(yè)務(wù)部門,老黃開始逐漸加深其在數(shù)據(jù)中心領(lǐng)域的強(qiáng)勁增長。
今天,依靠這次帶來的新的 Ampere 圖形架構(gòu),在 AI 計(jì)算、數(shù)據(jù)中心等領(lǐng)域上讓英偉達(dá)獲得了全面的「能力升級(jí)」。
黃仁勛的「廚房演講」| 英偉達(dá)官方
英偉達(dá)之前的成長很大程度上是依靠其游戲 GPU 處理器。如今,英偉達(dá)逐漸開始在眾多人工智能 AI 應(yīng)用程序方面顯現(xiàn)巨大的增長潛力。英偉達(dá)在 AI 領(lǐng)域的處理器,可以幫助提高 AI 語意理解能力,優(yōu)化搜索引擎建議,甚至賦能公共云以及物流,零售和倉儲(chǔ)等垂直行業(yè)。
在疫情期間,這些行業(yè)和應(yīng)用成為「必需品」。巨大的推動(dòng)力也為英偉達(dá)的收入和收益帶來了高于平均水平的增長。更重要的是,這也讓英偉達(dá)擺脫了短期加密貨幣的動(dòng)蕩影響,轉(zhuǎn)身跨入了一個(gè)新的增長時(shí)代。
全面投產(chǎn)的新「核彈基地」老黃今天宣布,基于 NVIDIA Ampere 架構(gòu)的首個(gè) GPU,即 NVIDIA A100,正在全面生產(chǎn)并向全球客戶發(fā)貨。
再說 NVIDIA A100 是「核彈」并不嚴(yán)謹(jǐn),它更像是一個(gè)「核彈基地」。A100 利用了英偉達(dá)安培架構(gòu)的設(shè)計(jì)突破,在其 8 代 GPU 中提供英偉達(dá)迄今為止最大的性能飛躍,將性能提高到其前輩的 20 倍。
NVIDIA A100 GPU | 英偉達(dá)官方
同時(shí),它是一個(gè)端到端機(jī)器學(xué)習(xí)加速器——從數(shù)據(jù)分析到訓(xùn)練再到推理。第一次在一個(gè)平臺(tái)上來統(tǒng)一人工智能訓(xùn)練和推理。A100 是一個(gè)通用的工作負(fù)載加速器,它也是為數(shù)據(jù)分析、科學(xué)計(jì)算和云圖形設(shè)計(jì)的。
「云計(jì)算和人工智能的強(qiáng)大趨勢(shì)正在推動(dòng)數(shù)據(jù)中心設(shè)計(jì)的結(jié)構(gòu)性轉(zhuǎn)變」黃仁勛說,「過去純 CPU 服務(wù)器的海洋,正在被 GPU 主導(dǎo)的加速計(jì)算基礎(chǔ)架構(gòu)所取代。」
黃仁勛說,買得越多,省得越多。(Buy more GPUs , the more money you save.)| 官方 Keynote
而貫徹「買更多,省更多」的宗旨,NVIDIA A100 將同時(shí)提高吞吐量并降低數(shù)據(jù)中心的成本。
A100 內(nèi)置了新的彈性計(jì)算技術(shù),可「靈活拆分」計(jì)算能力。多實(shí)例 GPU 能力允許每個(gè) A100 GPU 被分割成多達(dá)七個(gè)獨(dú)立的實(shí)例來推斷任務(wù),而第三代 NVIDIA NVLink interconnect 技術(shù)允許多個(gè) A100 GPU 作為一個(gè)巨型 GPU 運(yùn)行,以完成更大的訓(xùn)練任務(wù)。
第一批利用 NVIDIA A100 GPU 的是微軟,它將利用 NVIDIA A100 的來訓(xùn)練圖靈自然語言生成,這個(gè)世界上最大的語言模型。疫情期間,這也讓外賣巨頭 DoorDash 獲得了更強(qiáng)的能力,「這有助于減少模型訓(xùn)練時(shí)間,加快機(jī)器學(xué)習(xí)的開發(fā)過程?!笵oorDash 的機(jī)器學(xué)習(xí)工程師 Gary Ren 說。早期采用者還包括國家實(shí)驗(yàn)室和一些世界領(lǐng)先的高等教育和研究機(jī)構(gòu)。
NVIDIA A100 很快就會(huì)進(jìn)入云計(jì)算。包括 BAT 在內(nèi)的云業(yè)務(wù),字節(jié)跳動(dòng)、谷歌云、亞馬遜云 (AWS) 等幾乎主流大廠都將在產(chǎn)品中加入 A100 GPU。
當(dāng)然關(guān)于 NVIDIA A100 GPU,英偉達(dá)認(rèn)為這是一項(xiàng)「技術(shù)設(shè)計(jì)突破」,英偉達(dá)自己總結(jié)了五個(gè)關(guān)鍵創(chuàng)新推動(dòng):
● NVIDIA 全新安培 Ampere 架構(gòu)——A100 的核心是 NVIDIA Ampere GPU 架構(gòu),它包含超過 540 億個(gè)晶體管,使其成為世界上最大的 7 納米處理器。
●使用第三代 Tensor Core AI 核心,現(xiàn)在更加靈活、更快、更容易使用。他們的擴(kuò)展功能包括新的人工智能 TF32,它允許高達(dá) 20 倍的 FP32 精度的人工智能性能,沒有任何代碼更改。此外現(xiàn)在支持 FP64,為 HPC 應(yīng)用提供了比上一代多 2.5 倍的計(jì)算能力。
●多實(shí)例 GPU (Multi-instance GPU)——MIG,一個(gè)新的技術(shù)特性,可以將一個(gè) A100 GPU 分割成多達(dá) 7 個(gè)單獨(dú)的 GPU,這樣它就可以為不同大小的任務(wù)提供不同程度的計(jì)算,提供最優(yōu)的利用率和最大的投資回報(bào)。
●第三代 NVIDIA NVLink——使 GPU 之間的高速連接加倍,從而在服務(wù)器上提供高效的性能擴(kuò)展。
●結(jié)構(gòu)稀疏性——這種新的效率技術(shù)利用了人工智能數(shù)學(xué)固有的稀疏性,使性能提高了一倍。
NVIDIA A100 | 英偉達(dá)官方
總之,這些新特性使 NVIDIA A100 成為多樣化、高要求工作負(fù)載的理想選擇,包括人工智能培訓(xùn)和推理以及科學(xué)模擬、會(huì)話人工智能、推薦系統(tǒng)、基因組學(xué)、高性能數(shù)據(jù)分析、地震建模和財(cái)務(wù)預(yù)測(cè)。
今天英偉達(dá)也開始與開源社區(qū)合作,將端到端 GPU 加速引入 Apache Spark 3.0,這是一個(gè)用于大數(shù)據(jù)處理的分析引擎,全世界有 50 多萬數(shù)據(jù)科學(xué)家使用它。NVIDIA 的企業(yè)計(jì)算主管 Manuvir Das 說:「數(shù)據(jù)分析是當(dāng)今企業(yè)和研究人員面臨的最大的高性能計(jì)算挑戰(zhàn)?!埂笍?ETL 到訓(xùn)練再到推理,整個(gè) Spark 3.0 的 GPU 加速提供了最終連接大數(shù)據(jù)潛力和人工智能能力所需的性能和規(guī)模?!笰dobe 是首批在 Databricks 上運(yùn)行 Spark 3.0 預(yù)覽版的公司之一。在最初的測(cè)試中,它的性能提高了 7 倍,節(jié)省了 90% 的成本。它使用 GPU 加速數(shù)據(jù)分析,用于 Adobe 體驗(yàn)云中的產(chǎn)品開發(fā),并支持支持?jǐn)?shù)字業(yè)務(wù)的功能。
從「新玩家」到寶馬工廠,汽車行業(yè)的全面「滲透」NVIDIA DRIVE AGX 正為汽車行業(yè)初創(chuàng)公司提供 AI 驅(qū)動(dòng)力。
在 GTC Digital 期間,電動(dòng)汽車和自動(dòng)駕駛汽車初創(chuàng)公司小馬智行(Pony.ai)、Canoo 和法拉第未來(Faraday Future)紛紛宣布借助 NVIDIA DRIVE AGX 計(jì)算平臺(tái)開發(fā)汽車。這個(gè)高性能、高能效的平臺(tái)可實(shí)現(xiàn)跨級(jí)別的自動(dòng)駕駛,幫助企業(yè)進(jìn)行可靠的軟件定義車輛開發(fā)。
這幾家公司全都加入了一個(gè)廣泛的全球生態(tài)系統(tǒng)。該系統(tǒng)中的汽車制造商、一級(jí)供應(yīng)商、卡車制造商、傳感器供應(yīng)商、Robotaxi 公司和軟件初創(chuàng)公司均在 NVIDIA DRIVE 上進(jìn)行開發(fā)。
自動(dòng)駕駛技術(shù)公司小馬智行正在 NVIDIA DRIVE AGX Pegasus 上開發(fā)其新一代 Robotaxi 車隊(duì)。自 2018 年以來,該公司一直在加利福尼亞州和中國測(cè)試自動(dòng)駕駛車輛的叫車服務(wù)。今年 4 月,小馬智行開始在加利福尼亞州爾灣市提供自動(dòng)派送服務(wù),幫助因新冠疫情影響而在該地區(qū)隔離的人。
借助 DRIVE AGX Pegasus 自動(dòng)駕駛平臺(tái)來滿足 Robotaxi 上市所需的海量計(jì)算需求。Pegasus 計(jì)算平臺(tái)可實(shí)現(xiàn)每秒 320 萬億次(TOPS)深度學(xué)習(xí)運(yùn)算,內(nèi)置兩個(gè) NVIDIA Xavier 處理器和兩塊 NVIDIA Turing Tensor Core GPU。
電動(dòng)汽車初創(chuàng)公司 Canoo 推出了一款時(shí)尚的電動(dòng)汽車,這款汽車的風(fēng)格類似于大眾經(jīng)典車型 Microbus 的未來風(fēng)格。這款專用于共享出行服務(wù)的汽車將于 2021 年下半年投入生產(chǎn)。
Canoo 汽車將配備 NVIDIA DRIVE AGX Xavier 驅(qū)動(dòng)的 AI 輔助駕駛功能。該計(jì)算平臺(tái)具有 30 TOPS 物體探測(cè)和傳感器融合性能,能夠運(yùn)行構(gòu)建十字路口警報(bào)、盲點(diǎn)探測(cè)和行人探測(cè)功能的先進(jìn)算法,以及自適應(yīng)巡航控制和車道偏離預(yù)防等便捷功能。
軟件定義的 DRIVE AGX Xavier 還能引入更多市面上推出的高級(jí)功能,例如自動(dòng)車道變換、交通信號(hào)識(shí)別和規(guī)避轉(zhuǎn)向等。
小鵬最新推出的 P7 的 XPILOT3.0 就是使用了英偉達(dá) DRIVETM AGX Xavier 平臺(tái)。目前,小鵬還宣布將在下一代生產(chǎn)車型中利用 DRIVE 平臺(tái),小鵬自動(dòng)駕駛副總裁吳新宙博士說,「我們非常高興能在下一代電動(dòng)汽車生產(chǎn)模式上擴(kuò)大與 NIVIDA 的合作。」
就連許久未發(fā)聲的新造車鼻祖法拉第未來(Faraday Future)也宣布將在其旗艦豪華 FF 91 電動(dòng)車上部署 NVIDIA DRIVE AGX Xavier 平臺(tái),開發(fā)新一代 FF91。根據(jù) FF 的新計(jì)劃,F(xiàn)F 91 將在成功完成股權(quán)融資約 9 個(gè)月后開始交付。最新發(fā)布的 FF 81 EV 還將配備 DRIVE AGX Xavier,以及未來的型號(hào)和下一代核心技術(shù)。
寶馬集團(tuán)也在今天宣布,公司已經(jīng)選擇了新的 NVIDIA Isaac 機(jī)器人平臺(tái)來加強(qiáng)其汽車工廠——利用建立在先進(jìn)的人工智能計(jì)算和可視化技術(shù)上的物流機(jī)器人。
「利用人工智能和機(jī)器人技術(shù)上的突破,創(chuàng)造出可高度定制、準(zhǔn)時(shí)化、順序化的下一代生產(chǎn)模式?!估宵S說。
寶馬集團(tuán)負(fù)責(zé)物流的高級(jí)副總裁 Jürgen Maidl 說:「最終,大量可能的配置成為了寶馬集團(tuán)在三個(gè)基本領(lǐng)域的挑戰(zhàn)——計(jì)算、物流規(guī)劃和數(shù)據(jù)分析,」寶馬集團(tuán) (BMW Group) 的供應(yīng)鏈需要從 4500 多個(gè)供應(yīng)商站點(diǎn)向工廠輸送數(shù)百萬件零部件,涉及 23 萬個(gè)獨(dú)特的零部件編號(hào)。目前,寶馬銷售的車輛平均有 100 種不同的選擇,導(dǎo)致 99% 的客戶訂單彼此之間存在獨(dú)特的差異。這給工廠物流帶來了巨大的挑戰(zhàn)。
合作的核心是實(shí)現(xiàn)一個(gè)基于英偉達(dá)技術(shù)的端到端系統(tǒng)——從培訓(xùn)和測(cè)試到部署——使用一種軟件架構(gòu)開發(fā)的機(jī)器人,運(yùn)行在英偉達(dá)的開放 Isaac 機(jī)器人平臺(tái)上。寶馬集團(tuán)的目標(biāo)是提高物流工廠的流程,以生產(chǎn)定制配置的汽車更迅速和更有效。一旦開發(fā)完成,該系統(tǒng)將部署到寶馬集團(tuán)的全球工廠。
英偉達(dá)的增長源泉黃仁勛一直說,人工智能是未來增長的巨大潛在驅(qū)動(dòng)力。
第一個(gè)驅(qū)動(dòng)因素是「推理」的概念。推理,也稱為推理引擎,將邏輯規(guī)則應(yīng)用于知識(shí)庫以形成新信息。例如,可以利用客戶購買歷史、興趣以及他們的位置等事實(shí)來確定針對(duì)性的營銷計(jì)劃。
而人工智能增長的第二個(gè)推動(dòng)力是實(shí)現(xiàn)突破的模型算法能力。英偉達(dá)的產(chǎn)品具有低延遲性能,而 AI 應(yīng)用程序例如語言識(shí)別/理解程序和互聯(lián)網(wǎng)搜索推薦系統(tǒng),這些系統(tǒng)現(xiàn)在正在使用深度學(xué)習(xí)。
第三個(gè)驅(qū)動(dòng)力是公共云的增長。公共云的增長來自許多在云中開發(fā) AI 軟件的 AI 初創(chuàng)公司。黃仁勛(Jensen Huang)表示,人工智能初創(chuàng)企業(yè)數(shù)量達(dá)數(shù)千家。由于公共云可以支持規(guī)模較小且剛剛起步的公司,因此易于使用。
人工智能的第四增長動(dòng)力是垂直行業(yè)。這包括物流,零售和倉儲(chǔ)。沃爾瑪(WMT),美國郵政(USPS)和美國運(yùn)通(AXP)等公司/組織擁有大量需要分析/預(yù)測(cè)分析的數(shù)據(jù)。
同時(shí),這一領(lǐng)域還需要邊緣 AI 計(jì)算。這樣能保證進(jìn)行實(shí)時(shí)操作,例如包括機(jī)器人、自動(dòng)駕駛汽車的某些操作,數(shù)據(jù)創(chuàng)建以及需要在幾毫秒內(nèi)發(fā)生的決策。
我們可能會(huì)更容易的從 AI 中看到現(xiàn)實(shí)世界的解決方案:增強(qiáng)的購物體驗(yàn)(更好的庫存系統(tǒng)/更智能的布局/更智能的結(jié)帳系統(tǒng)),增強(qiáng)的汽車自動(dòng)駕駛視覺計(jì)算性能/解決方案,實(shí)時(shí)交通監(jiān)控以確保更安全的道路,基因組計(jì)算,5G 加速等等。
這些各種行業(yè)中 AI 應(yīng)用程序的增長空間可能會(huì)給英偉達(dá)帶來一個(gè)可以實(shí)現(xiàn)數(shù)年的持續(xù)增長的領(lǐng)域。Grand View Research 估計(jì),到 2025 年,全球 AI 市場(chǎng)將以每年約 46%的速度增長。
我們發(fā)現(xiàn),英偉達(dá)不在是一個(gè)單純的 GPU 硬件公司,它正在成長為一個(gè)「生態(tài)型」的基礎(chǔ)設(shè)施,跑在一個(gè)高速增長的時(shí)代下。