解密英偉達(dá)Tesla P100、GP100、DRIVE PX2平臺
在今年4月初開幕的圖形處理器技術(shù)大會上,NVIDIA展示了針對VR虛擬現(xiàn)實和深度學(xué)習(xí)應(yīng)用的最新技術(shù)和產(chǎn)品。NVIDIA聯(lián)合創(chuàng)始人兼CEO黃仁勛在反復(fù)重申“一個全新的計算模型”這樣的字眼。他指出,“消費市場需要的計算機可再也不是那種馬馬虎虎就能打發(fā)的一般產(chǎn)品。大家都愿意享受超級計算速率帶來的快感,特別是基于GPU加速帶來的計算體驗”。
當(dāng)然,超級計算時代的到來并非只是想想就能實現(xiàn)的,基于這樣的目標(biāo),NVIDIA在今年的GTC大會上推出了包括GPU芯片Tesla P100(基于全新Pascal平臺架構(gòu)上打造)、DRIVE PX2(用于自動駕駛汽車的開發(fā)平臺)和用于深度學(xué)習(xí)研究的超級計算機DGX-1(使用Tesla P100芯片建造,運算速度可達(dá)170萬億次)在內(nèi)的一系列新技術(shù)和新產(chǎn)品。
基于NVIDIA全新計算平臺Pascal打造的Tesla P100 GPU芯片集成了NV Link總線,16GB HBM2顯存,內(nèi)建3584個CUDA,224個紋理單元,16GB HBM2顯存,帶寬可達(dá)到720GB/s,擁有基于16nm FinFET工藝打造的最大GPU核心。
△NVIDIA Tesla P100圖形處理器芯片
此外,Tesla P100芯片也是繼2014年發(fā)布,基于Kepler架構(gòu)平臺打造的Tesla K80之后,Tesla系列GPU產(chǎn)品的首次重大升級。
不過既然這是一款針對深度學(xué)習(xí)打造的GPU芯片,那么這里還必須要提一下Tesla P100芯片使用的NVIDIA旗艦GP100核心。GP100的性能一公布,給車云菌的感覺就是NVIDIA這次回歸了GK110大核心時代注重雙精度運算的設(shè)計,而且比之前更加變態(tài)。它每組SM單元中有64個FP32單元,但有32個FP64單元,F(xiàn)P64與FP32比例是1:2。這樣的設(shè)計意味著GP100的FP32 CUDA核心可以同時執(zhí)行2個FP16半精度運算,因此FP16浮點性能高達(dá)21.6TFLOPS。
△NVIDIA GP100核心架構(gòu)示意圖
GPU并行運算的特性很適合深度學(xué)習(xí)。據(jù)車云菌了解,NVIDIA在Tesla P100之外還推出了基于GP100核心的DGX-1深度學(xué)習(xí)超級計算機,由8顆GP100核心及2顆16核Xeon E5處理器組成,深度計算性能達(dá)到了170TFLOPS,號稱比250臺X86服務(wù)器還要強大。
△NVIDIA 超級計算機DGX-1 售價高達(dá)$129000,真心不便宜
在過去的兩年里,每次GTC大會的主題演講環(huán)節(jié),黃仁勛都會將話題的重點放在深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)研究上,并適時推出相關(guān)的新技術(shù)和新產(chǎn)品,而這些為NVIDIA之后進(jìn)行人工智能的研究奠定了基礎(chǔ)。今年也不例外。除了基于Pascal全新架構(gòu)平臺打造的Tesla P100芯片外,NVIDIA還發(fā)布了兩款Maxwell計算平臺下的全新GPU芯片—Tesla M40/M4,是為深度學(xué)習(xí)應(yīng)用而特別打造的。