游戲+云服務(wù)器+自動駕駛一個不少,看NVIDIA為中國市場帶來了什么?
近日,NVIDIA在蘇州舉辦了GTC China大會。四方趕來的與會者對這場在中國舉辦的技術(shù)大會倍加期待,希望黃仁勛在這場技術(shù)盛會上能為中國市場帶來新鮮勁爆的消息。
10點整,一身職業(yè)皮夾克裝的黃教主準(zhǔn)時登上了演講臺,其強(qiáng)大的個人魅力瞬間引來了全場的歡呼和掌聲。
RTX系列顯卡demo:游戲畫面表現(xiàn)力達(dá)到新高度
作為一家以高性能計算著稱的GPU企業(yè),黃仁勛首先介紹了其全新RTX系列圖形處理器的強(qiáng)大能力。
黃仁勛在現(xiàn)場宣布與網(wǎng)易建立技術(shù)合作,其網(wǎng)絡(luò)游戲《逆水寒》將成為國內(nèi)首款應(yīng)用實時光線追蹤技術(shù)的游戲。
現(xiàn)場還實時演示了《逆水寒》的全新技術(shù)demo,依托RTX顯卡的全新技術(shù)和強(qiáng)大性能,游戲的畫面表現(xiàn)力達(dá)到了一個新高度。在開啟RTX之后,游戲的光影的渲染有了脫胎換骨的飛躍,湖面的波光、金屬的反射都處理的更加真實,虛擬的世界變得更加鮮活。
除了實時光線追蹤,《逆水寒》也將同時支持基于AI的DLSS高性能抗鋸齒技術(shù),黃仁勛表示DLSS可帶來1.8倍性能提升。
GPU加速平臺HGX-2
RTX之后,黃仁勛還在現(xiàn)場介紹了其早前發(fā)布的GPU加速平臺HGX-2。HGX-2由NVIDIA的16個高端V100 GPU組成,使用NVSwitch高速互聯(lián)總線將16個GPU完全連接為一個整體來使用,其能在單節(jié)點中提供2PFLOPS計算性能。
作為云服務(wù)器平臺,HGX-2具備多精度計算能力,支持面向科學(xué)計算和模擬的高精度FP64和FP32計算,也支持AI訓(xùn)練和推理所用的FP16和INT8精度。與僅使用CPU的服務(wù)器相比,它將AI機(jī)器學(xué)習(xí)工作負(fù)載的運行速度提升近550倍,將AI深度學(xué)習(xí)工作負(fù)載的運行速度提升近300倍,將高性能計算工作負(fù)載的運行速度提升近160倍。
黃仁勛提到,浪潮是中國首家構(gòu)建HGX-2服務(wù)器的廠商,浪潮AI超級服務(wù)器AGX-5專為解決當(dāng)前AI深度學(xué)習(xí)和高性能計算的性能擴(kuò)展難題而設(shè)計。此外,包括百度、騰訊、阿里巴巴在內(nèi)的諸多客戶,也在借助HGX-2為內(nèi)部應(yīng)用及云客戶提供一系列更強(qiáng)大的AI服務(wù);聯(lián)想、華為、曙光也已宣布成為HGX-2云服務(wù)器平臺的合作伙伴。
T4云計算卡
緊接著,黃仁勛還介紹了其T4云計算卡。T4基于全新 NVIDIA Turing架構(gòu),采用多精度Turing Tensor Core和全新RT Core,與加速的容器化軟件堆棧相結(jié)合,T4的多精度功能可支持4種不同精度等級的各類AI工作負(fù)載,助力實現(xiàn)突破性的AI性能,F(xiàn)P32精度能夠提供8.1TFLOPS,F(xiàn)P16精度能夠提供65TFLOPS,INT8精度能夠提供130TOPS,INT4精度能夠提供260TOPS。
憑借其強(qiáng)大的加速能力,百度、騰訊、京東和科大訊飛將開始使用Turing云GPU加速超大規(guī)模數(shù)據(jù)中心;浪潮、聯(lián)想、華為、曙光、浪潮商用機(jī)器和新華三均宣布推出基于全新T4的服務(wù)器。
黃仁勛在現(xiàn)場演示了基于百度圖片識別引擎的demo,在使用Intel Skylake架構(gòu)的純CPU服務(wù)器時,運算速度只有4~5fps,而換用4塊T4計算卡后,運算速度飆升至6200fps。在將計算卡數(shù)量增至28塊時,運算速度也呈線性增長至43500fps,可見其可擴(kuò)展性非常優(yōu)秀。
開源GPU加速平臺Rapids
在詳細(xì)闡述完上述計算加速硬件后,黃仁勛還簡要推介了其開源的 GPU 加速平臺 Rapids,該平臺于今年10月發(fā)布,是一款針對數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的GPU加速平臺,為數(shù)據(jù)科學(xué)家提供標(biāo)準(zhǔn)化的流水線式工具,數(shù)據(jù)處理速度較僅用CPU提升50倍。
RAPIDS構(gòu)建于Apache Arrow、PANDAS和SKLEARN等組件之上,通過CUDF數(shù)據(jù)過濾、CUML機(jī)器學(xué)習(xí)、CUGRAPH數(shù)據(jù)圖像化來加速處理數(shù)據(jù),為最流行的Python數(shù)據(jù)科學(xué)工具鏈帶來了GPU提速。
這三套軟件工具都是基于CUDA開發(fā),可以把它們看成是CUDA的一部分。其中CUDF與Pandas的功能非常類似,Pandas的所有功能都可以在CUDF里找到對應(yīng)的API;CUML則對應(yīng)SKLEARN,無論是分類、聚類、回歸等算法都可以在CUML里面找到。而CUGRAPH目前尚未正式推出,預(yù)計會在明年正式集成到RAPIDS中。
黃仁勛介紹到,平安科技最近對RAPID進(jìn)行了試用,這是一個GPU加速的新開源平臺,適用于大規(guī)模的數(shù)據(jù)分析和機(jī)器學(xué)習(xí),讓數(shù)據(jù)科學(xué)家首次能夠在GPU上運行數(shù)據(jù)科學(xué)管線,并大幅縮短數(shù)據(jù)集處理時間。
平安科技使用RAPIDS以及GPU加速的PCA和DBSCAN之后,工作流程執(zhí)行速度加快了80倍,從幾天縮短到幾小時(包括數(shù)據(jù)加載和訓(xùn)練時間),這有助于該公司主動做出預(yù)測并完善預(yù)防計劃。
中國最大的基因公司華大基因同樣擁有超過1PB的海量數(shù)據(jù)存放在數(shù)據(jù)庫中。華大基因使用一種名叫XGBoost的機(jī)器學(xué)習(xí)算法,對用于癌癥患者個性化免疫治療的靶向多肽進(jìn)行分類。他們隊在NVIDIA DGX-1 AI超級計算機(jī) 超級計算機(jī)上運行RAPIDS平臺,將分析速度提高了17倍,并將多肽的分析范圍擴(kuò)大至數(shù)百萬種。
自動駕駛:關(guān)鍵詞“車規(guī)級”和“全面量產(chǎn)”
最后壓軸出場的則是被NVIDIA寄予厚望的Jetson AGX Xavier AI計算平臺。Xavier是世界首個用于自主機(jī)器的AI計算平臺,在Xaiver基礎(chǔ)上,NVIDIA打造了一個全新的產(chǎn)品家族DRIVE AGX,目前兩大主力產(chǎn)品為基礎(chǔ)的DIRVE AGX Xaiver和高性能的DRIVE AGX Pegasus。
目前,中國很多初創(chuàng)汽車企業(yè)、貨運公司和領(lǐng)先的供應(yīng)商為其即將推出的自動駕駛系統(tǒng)平臺選用NVIDIA DRIVE AGX開發(fā)套件。一汽集團(tuán)(FAW Group)是中國最大的卡車制造商之一,正在與自動駕駛初創(chuàng)公司智加科技(PlusAI)和物流公司滿幫集團(tuán)(Full Truck Alliance, FTA)合作開發(fā)無人駕駛商用卡車車隊,計劃于2021年進(jìn)行大規(guī)模部署。
據(jù)悉,一汽集團(tuán)將采用運算能力高達(dá)每秒320萬億次的AI超級計算機(jī)NVIDIA DRIVE AGX Pegasus,為其即將推出的自動駕駛卡車的運行提供支持,并加速中國長途運輸行業(yè)的升級。
除了汽車制造商之外,Weride.ai、Momenta、圖森未來、AutoX以及Roadstar.ai等自動駕駛初創(chuàng)企業(yè)也更傾向于選擇。目前為止,有超過370家公司在自家自動駕駛生態(tài)系統(tǒng)中使用NVIDIA DRIVE AGX Xavier平臺。
總部位于中國廣州的初創(chuàng)公司小鵬汽車將使用DRIVE AGX Xavier,致力于在2020年打造面向量產(chǎn)車型的L3級自動駕駛系統(tǒng);SF Motors也計劃于明年推出其首款電動分頻器SF5,并表示將采用DRIVE AGX Xavier開發(fā)下一代自主計算平臺。此外DRIVE AGX Xavier還為奇點汽車即將推出的車輛提供技術(shù)支持,期望于2020年實現(xiàn)量產(chǎn)L3級自動駕駛產(chǎn)品。
為了展示NVIDIA自動駕駛芯片的強(qiáng)大算力,黃仁勛在現(xiàn)場放出了搭載Pegasus的NVIDIA無人車在硅谷的高速道路上進(jìn)行了一段實地路測。
在這段總長度為50英里的路測中,駕駛員全程都未觸碰方向盤,由無人車自行完成了所有的行車操作。從車上的實時影像可以看出,Pegasus支持的無人車對車道線、標(biāo)志、各類道路參與者進(jìn)行實時的識別、分割、追蹤,感知效果相當(dāng)強(qiáng)大。
同時,京東、美團(tuán)、菜鳥等電商巨頭的人工智能配送機(jī)器人,均搭載了NVIDIA Jetson AGX Xavier開發(fā)者套件。雖然配送車及其電池的尺寸較小,但傳感、定位和路徑規(guī)劃所需的處理量與大型無人駕駛車輛相同,且很大程度上依賴于Jetson AGX Xavier 的高性能計算。
此外,Jetson AGX Xavier平臺還配備了NVIDIA JetPack SDK。這套完整的AI開發(fā)軟件解決方案,涵蓋了最新版本的CUDA、cuDNN和TensorRT,以及用于簡化并加速開發(fā)的高級軟件代碼?;诖耍绍浖x的配送機(jī)器人等自主機(jī)器,完全可以通過線上更新完成性能提高及添加功能等工作。