如果李佳琦跨界帶貨GPU,那鐵定不如黃仁勛。但現(xiàn)場的感覺又如同李佳琦的直播一般,一句 “The more you buy ,the more you save”像極了“OMG”,你能忍住不心動?
偌大的演講大廳烏央央一片,塞下幾千人,一眼望不見頭,舞臺角落放著兩瓶礦泉水,一場大型年度“帶貨”大會即將開始。
NVIDIA GTC 2019大會今年參加人數(shù)多達(dá)6100人,幾年來翻番的漲,大家?guī)е鴮VIDIA(英偉達(dá))崇拜之情從各個城市趕來,匯聚一堂,當(dāng)然也有不少和筆者一樣,對本屆GTC大會主角黃仁勛(英偉達(dá)CEO)更感興趣。去年一句“快來買吧,超便宜的!”深深刻在腦海,今年一句 “The more you buy ,the more you save?!秉c嗨全場。
我猜所有人都在盤算,今年又要瘋狂“推銷”哪些產(chǎn)品?
燈光、音響……各單位注意,黃教主登場,Action!

一
蘇州一夜之間陡降10℃,考驗黃教主皮衣耐寒程度的時候到了。
二話不說,先秀成績。“僅在去年,我們就發(fā)布了500多個SDK和庫,其中既有全新內(nèi)容,也有更新版本。為了提高GPU性能,深度學(xué)習(xí)訓(xùn)練在3年內(nèi)提高4倍,深度學(xué)習(xí)推理在1年內(nèi)提高2倍?!?

黃教主一面告訴我們摩爾定律快到頭了,一面又表現(xiàn)自己硬件性能還在反規(guī)律提升。并表示,出色的芯片只是起點,因為軟件優(yōu)化成了大力丸,而NVIDIA的CUDA平臺具有豐富的庫、工具和應(yīng)用程序。
此外,在會議介紹后的媒體采訪中,黃教主表示:“制程雖然很重要,但不是最重要的。RTX芯片和光線追蹤技術(shù)在12nm制程情況下,達(dá)到AMD 7nm制程GPU水平?!彼惴ā④浖?、架構(gòu)等全棧優(yōu)化的組合拳果然威力驚人。
如今英偉達(dá)已經(jīng)售出15億塊GPU。
英偉達(dá)專注于加速計算領(lǐng)域,致力于解決普通計算機無法解決的問題,在垂直市場中將GPU、深度專業(yè)知識、計算堆棧、算法和生態(tài)系統(tǒng)專業(yè)知識集于一體。立足一個架構(gòu),從游戲到汽車再到醫(yī)療健康。
二
上個月,英偉達(dá)公布2020財年 Q3財報,收入高達(dá)30.1億美元,其中游戲業(yè)務(wù)就占到16.6億美元。游戲撐起來了英偉達(dá)的半壁江山,GTC 2019的“帶貨”現(xiàn)場也是從游戲開始。
現(xiàn)場,黃仁勛宣布6款支持RTX的游戲,為《暗影火炬》《project X》《無限法則》《軒轅劍柒》《鈴蘭計劃》《邊境》,表明RTX技術(shù)的開發(fā)者數(shù)量飆升。

所謂光線追蹤技術(shù)其實就是將光源產(chǎn)生的光線所產(chǎn)生的折射,反射等光線變化和對陰影產(chǎn)生的反應(yīng)通過計算準(zhǔn)確的反映到畫面之中,為人們帶來百分之百的光影效果。
此前,英偉達(dá)和微軟還共同宣布《我的世界》將支持RTX。黃仁勛稱,《我的世界》是由用戶創(chuàng)造的世界,因此無法預(yù)烘焙GI(全局光照)和一般反射之類的燈光效果,而RTX可以實時妥善完成這些操作。

總結(jié)起來一個字,真,兩個字,逼真。玩家在游戲里創(chuàng)造了“我的世界”,英偉達(dá)撒下一片光明。
當(dāng)你還在沉浸在唯美畫面的視頻中時,黃仁勛端出一臺筆記本——采用MAX-Q的超薄筆記本。今年年初的CES上,聯(lián)想就秀了一把英偉達(dá)RTX 2080 Max-Q顯卡的拯救者Y9000K。教主現(xiàn)場表示,Max-Q設(shè)計將超高GPU能效和總體系統(tǒng)優(yōu)化集于一身,使功能強大的GPU用于輕薄的筆記本。

“中國游戲筆記本電腦發(fā)貨量超過500萬臺,在5年內(nèi)增加了4倍。GeForce RTX Max-Q筆記本電腦是增長速度最快的游戲平臺?!焙闷诖藭r黃仁勛會說一句“OMG”,那樣全球的游戲玩家就如同拜倒在李佳琦“OMG”聲中的女粉們,欲罷不能。
此外,今天騰訊游戲和英偉達(dá)宣布了一項將電腦游戲帶入云端的合作。資料顯示,英偉達(dá)的GPU技術(shù)為騰訊游戲的START云游戲服務(wù)賦力,該服務(wù)已從今年初開始進(jìn)入測試階段。START使游戲玩家可以隨時隨地,即使是在配置不足的設(shè)備上也能玩AAA游戲。騰訊游戲計劃將擴展其云游戲產(chǎn)品,為數(shù)百萬玩家提供與本地游戲設(shè)備一致的游戲體驗。

英偉達(dá)和騰訊游戲還宣布成立一個游戲聯(lián)合創(chuàng)新實驗室。雙方將共同探索AI在游戲、游戲引擎優(yōu)化和新光照技術(shù)(包括光線追蹤和光線烘焙)中的新應(yīng)用。
讓游戲逼真顯然是不夠的。
會上,黃仁勛宣布,瑞云云渲染平臺將配備NVIDIA RTX GPU,首批5000片RTX GPU將在2020年上線。其中超過85%的中國電影工作室都是瑞云的客戶,《戰(zhàn)狼2》、《哪吒》和《流浪地球》就是出自其手,堪稱全亞洲最大的云渲染平臺。
黃仁勛還發(fā)布了面向建筑行業(yè)(AEC)的Omniverse開放式3D設(shè)計協(xié)作平臺,本地和云端均支持在AEC工作流中增加實時協(xié)作功能,將支持Autodest REVIT、Trimble SketchUP和McNeel Rhino等主流AEC應(yīng)用。

現(xiàn)場一則實例中,“原本花費485小時的渲染場景,現(xiàn)在只需不到40小時就渲染完成?!贝颂帒?yīng)該又有“OMG”。
其中,NVIDIA Omniverse是一個面向3D制作流程的協(xié)作平臺,基于Pixar公司的Universal Scene Description技術(shù),并由NVIDIA RTX提供支持。
三
我相信李佳琦看了黃教主意氣風(fēng)發(fā)的“帶貨”現(xiàn)場都要自愧不如,居然帶的還都是剛出爐的新貨。
比如,英偉達(dá)今天宣布發(fā)布NVIDIA Parabricks基因組分析工具包。其中Parabricks是一個CUDA加速的基因組處理工具包可與用于發(fā)現(xiàn)變異并能產(chǎn)生與行業(yè)標(biāo)準(zhǔn)GATK最佳實踐流程一致的結(jié)果。并能夠?qū)崿F(xiàn)30-50倍的加速,Parabricks可以提供DeepVariant工具,利用深度學(xué)習(xí)技術(shù)進(jìn)行基因變異檢測。
此外,據(jù)現(xiàn)場透露,華大基因已采用Parabricks,借助若干GPU服務(wù)器,華大基因可以按其測序儀生成的數(shù)據(jù)的速率來處理基因組。而且,今年英偉達(dá)為CUDA增加了兩個新的主流應(yīng)用5G vRAN和基因組處理。
再比如,現(xiàn)場發(fā)布推理軟件TensorRT 7,這是英偉達(dá)第七代推理軟件開發(fā)套件,打開了智能AI人機交互的新世界,實現(xiàn)與語音代理、聊天機器人和推薦引擎等應(yīng)用進(jìn)行實時互動。
據(jù)介紹,TensorRT 7內(nèi)置新型深度學(xué)習(xí)編譯器。該編譯器能夠自動優(yōu)化和加速遞歸神經(jīng)網(wǎng)絡(luò)與基于轉(zhuǎn)換器的神經(jīng)網(wǎng)絡(luò)。這些日益復(fù)雜的神經(jīng)網(wǎng)絡(luò)是AI語音應(yīng)用所必需的。與在CPU上運行時相比,會話式AI組件速度提高了10倍以上,從而將延遲降低到實時交互所需的300毫秒閾值以下。

“我們已進(jìn)入了一個機器可以實時理解人類語言的AI新時代。”黃仁勛一句話總結(jié)。
再再比如,黃仁勛發(fā)布用于自動駕駛和機器人的高度先進(jìn)的軟件定義平臺——NVIDIA DRIVE AGX Orin。

該平臺內(nèi)置全新Orin系統(tǒng)級芯片。該芯片由170億個晶體管組成,凝聚著NVIDIA團隊為期四年的努力。Orin系統(tǒng)級芯片集成了NVIDIA新一代GPU架構(gòu)和Arm Hercules CPU內(nèi)核以及全新深度學(xué)習(xí)和計算機視覺加速器,每秒可運行200萬億次計算,幾乎是NVIDIA上一代Xavier系統(tǒng)級芯片性能的7倍。此外,Orin可處理在自動駕駛汽車和機器人中同時運行的大量應(yīng)用和深度神經(jīng)網(wǎng)絡(luò),并且達(dá)到了ISO 26262 ASIL-D等系統(tǒng)安全標(biāo)準(zhǔn)。
在汽車領(lǐng)域,黃仁勛還宣布,英偉達(dá)將在 NVIDIA GPU Cloud (NGC) 容器注冊上,向交通運輸行業(yè)開源 NVIDIA DRIVE自動駕駛汽車開發(fā)深度神經(jīng)網(wǎng)絡(luò)。如今,NVIDIA 向自動駕駛汽車開發(fā)者開源其預(yù)訓(xùn)練 AI 模型和訓(xùn)練代碼。通過一套 NVIDIA AI 工具,NVIDIA 生態(tài)系統(tǒng)內(nèi)的開發(fā)者們可以自由擴展和自定義模型,從而提高其自動駕駛系統(tǒng)的穩(wěn)健性與能力。

此外,現(xiàn)場英偉達(dá)還宣布和滴滴合作,滴滴將在數(shù)據(jù)中心使用NVIDIA GPU訓(xùn)練機器學(xué)習(xí)算法,并采用NVIDIA DRIVE為其L4級自動駕駛汽車提供推理能力。為了訓(xùn)練這些深度神經(jīng)網(wǎng)絡(luò),滴滴將采用NVIDIA GPU數(shù)據(jù)中心服務(wù)器。在云計算方面,滴滴還將構(gòu)建領(lǐng)先的AI基礎(chǔ)架構(gòu),并推出計算型、渲染型和游戲型vGPU云服務(wù)器。

滴滴云將采用新的vGPU許可證模式,旨在為用戶提供體驗更佳、應(yīng)用場景更豐富、效率更高、更具創(chuàng)新性和靈活的GPU計算云服務(wù)。目前,滴滴云已與NVIDIA等行業(yè)合作伙伴攜手服務(wù)交通出行、AI、圖形渲染、電子游戲及教育培訓(xùn)等多個領(lǐng)域。
再再再比如,NVIDIA發(fā)布全新版本Isaac軟件開發(fā)套件(SDK),為機器人提供更新的AI感知和仿真功能。
Isaac SDK 包括 Isaac Robotics Engine(提供應(yīng)用程序框架),Isaac GEM(預(yù)先構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)模型、算法、庫、驅(qū)動程序和API),用于室內(nèi)物流的參考應(yīng)用程序以及Isaac Sim的第一個版本(提供導(dǎo)航功能)。
而全新Isaac SDK可以大大加快研究人員、開發(fā)人員、初創(chuàng)企業(yè)和制造商開發(fā)和測試機器人的速度。它使機器人能夠通過仿真獲得由人工智能技術(shù)驅(qū)動的感知和訓(xùn)練功能,可以在各種環(huán)境和情況下對機器人進(jìn)行測試和驗證。
四
黃仁勛在現(xiàn)場用一張PPT上顯示了2019年天貓全球狂歡節(jié)的交易成績單,他不明白為什么這一天會有這么多人同時進(jìn)行交易,但這不影響他宣布阿里巴巴推薦系統(tǒng)采用NVIDIA AI,并表示CPU速度太慢了,只有3QPS,但英偉達(dá)的GPU可以提升至780QPS。

說完略帶停頓,全場響起掌聲,欽佩于780比3,但也可能是停頓處就該自然鼓掌。
此外還宣布了百度推薦系統(tǒng)也采用了NVIDIA AI,有100多個推薦模型被使用在百度的眾多應(yīng)用中。其中百度龐大的用戶潛在興趣數(shù)據(jù)包含了千億維稀疏離散特征和10TB embedding詞表。
同樣,訓(xùn)練此模型在CPU上成本高昂且速度慢,據(jù)悉,GPU訓(xùn)練成本只有CPU的1/10。
雖然黃仁勛沒有提過一句具體成本情況,但經(jīng)常說“The more you buy ,the more you save”。暴力增加性能后,總會在高階、大數(shù)據(jù)量的應(yīng)用情況下,節(jié)約出成本。而人工智能時代,又需要這種暴力。
