解密英偉達(dá)Tesla P100、GP100、DRIVE PX2平臺

時間：2020-08-26 09:24:01

關(guān)鍵字：人工智能汽車電子英偉達(dá)

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀] 　　在今年4月初開幕的圖形處理器技術(shù)大會上，NVIDIA展示了針對VR虛擬現(xiàn)實和深度學(xué)習(xí)應(yīng)用的最新技術(shù)和產(chǎn)品。NVIDIA聯(lián)合創(chuàng)始人兼CEO黃仁勛在反復(fù)重申“一個全新的計算模型&rd

　　在今年4月初開幕的圖形處理器技術(shù)大會上，NVIDIA展示了針對VR虛擬現(xiàn)實和深度學(xué)習(xí)應(yīng)用的最新技術(shù)和產(chǎn)品。NVIDIA聯(lián)合創(chuàng)始人兼CEO黃仁勛在反復(fù)重申“一個全新的計算模型”這樣的字眼。他指出，“消費市場需要的計算機可再也不是那種馬馬虎虎就能打發(fā)的一般產(chǎn)品。大家都愿意享受超級計算速率帶來的快感，特別是基于GPU加速帶來的計算體驗”。

　　當(dāng)然，超級計算時代的到來并非只是想想就能實現(xiàn)的，基于這樣的目標(biāo)，NVIDIA在今年的GTC大會上推出了包括GPU芯片Tesla P100（基于全新Pascal平臺架構(gòu)上打造）、DRIVE PX2（用于自動駕駛汽車的開發(fā)平臺）和用于深度學(xué)習(xí)研究的超級計算機DGX-1（使用Tesla P100芯片建造，運算速度可達(dá)170萬億次）在內(nèi)的一系列新技術(shù)和新產(chǎn)品。

　　基于NVIDIA全新計算平臺Pascal打造的Tesla P100 GPU芯片集成了NV Link總線，16GB HBM2顯存，內(nèi)建3584個CUDA，224個紋理單元，16GB HBM2顯存，帶寬可達(dá)到720GB/s，擁有基于16nm FinFET工藝打造的最大GPU核心。

　　△NVIDIA Tesla P100圖形處理器芯片

　　此外，Tesla P100芯片也是繼2014年發(fā)布，基于Kepler架構(gòu)平臺打造的Tesla K80之后，Tesla系列GPU產(chǎn)品的首次重大升級。

　　不過既然這是一款針對深度學(xué)習(xí)打造的GPU芯片，那么這里還必須要提一下Tesla P100芯片使用的NVIDIA旗艦GP100核心。GP100的性能一公布，給車云菌的感覺就是NVIDIA這次回歸了GK110大核心時代注重雙精度運算的設(shè)計，而且比之前更加變態(tài)。它每組SM單元中有64個FP32單元，但有32個FP64單元，F(xiàn)P64與FP32比例是1：2。這樣的設(shè)計意味著GP100的FP32 CUDA核心可以同時執(zhí)行2個FP16半精度運算，因此FP16浮點性能高達(dá)21.6TFLOPS。

　　△NVIDIA GP100核心架構(gòu)示意圖

　　GPU并行運算的特性很適合深度學(xué)習(xí)。據(jù)車云菌了解，NVIDIA在Tesla P100之外還推出了基于GP100核心的DGX-1深度學(xué)習(xí)超級計算機，由8顆GP100核心及2顆16核Xeon E5處理器組成，深度計算性能達(dá)到了170TFLOPS，號稱比250臺X86服務(wù)器還要強大。

　　△NVIDIA 超級計算機DGX-1 售價高達(dá)$129000，真心不便宜

　　在過去的兩年里，每次GTC大會的主題演講環(huán)節(jié)，黃仁勛都會將話題的重點放在深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)研究上，并適時推出相關(guān)的新技術(shù)和新產(chǎn)品，而這些為NVIDIA之后進(jìn)行人工智能的研究奠定了基礎(chǔ)。今年也不例外。除了基于Pascal全新架構(gòu)平臺打造的Tesla P100芯片外，NVIDIA還發(fā)布了兩款Maxwell計算平臺下的全新GPU芯片—Tesla M40/M4，是為深度學(xué)習(xí)應(yīng)用而特別打造的。