Raja Koduri采訪:GPU計算夙愿在英特爾實現(xiàn) oneAPI一統(tǒng)異構(gòu)運算
除了i740曇花一現(xiàn)的獨顯之外,英特爾似乎并不是GPU市場的主角,但在GPU計算歷史上,英特爾一直不曾缺席,現(xiàn)在英特爾終于站到舞臺中央了。
在前幾天的SC 19大會上,英特爾高級副總裁、首席架構(gòu)師以及架構(gòu)、圖形與軟件部門總經(jīng)理Raja Koduri正式宣布了面向HPC高性能計算的英特爾的Xe架構(gòu)GPU—;—;Ponte Vecchio,這是英特爾首款7nm芯片,也會用上Foveros 3D、EMIB(嵌入式多芯片互連橋接)等先進封裝技術(shù),是英特爾HPC產(chǎn)品的集大成者。
在這個產(chǎn)品背后,英特爾及Raja Koduri到底有著怎樣的野心?美國ZDNET網(wǎng)站日前刊發(fā)了對Raja Koduri的一篇介紹,談到了英特爾在GPU計算上的宏偉愿景。
以下是ZDNET全文內(nèi)容:
我們正處于高性能計算的轉(zhuǎn)折點—;—;Raja Koduri
十四年前,Raja Koduri幫助開啟了GPU計算時代,這比NVIDIA創(chuàng)始人黃仁勛談?wù)摚℅PU計算)甚至還要早一年,這個想法就是—;—;GPU不僅可以用于完成流暢的視頻游戲渲染,還可以處理科學(xué)問題。
如今這個愿景已經(jīng)成為現(xiàn)實,因為GPU成為了AI人工智能及越來越多的高性能計算的主力軍。
Raja Koduri當(dāng)時在AMD公司工作,如今他成為了英特爾的首席架構(gòu)師,他坐下來跟ZDNET一起討論了GPU計算是如何不斷革命的。
Raja Koduri說,“我們正處于高性能計算的轉(zhuǎn)折點上?!?二十年前,HPC高性能計算被垂直集成的架構(gòu)所主導(dǎo),但是之后,商業(yè)化的X86處理器在開源軟件及各種庫文件擴展接管了HPC計算,現(xiàn)在不只是HPC,所有集群都變成了X86及大量軟件主導(dǎo)。
Raja Koduri表示這種軟件運動正在主導(dǎo)新的計算時代,它可以被重新編程,像超級計算機一樣強大。
“在AI及異構(gòu)驅(qū)動非線性增長的情況下,我們將看到下一次周期?!?/p>
在Raja Koduri作出如上表態(tài)的同時,英特爾在周日宣布了新的GPU,它專門為HPC高性能計算而設(shè)計,代號為Ponte Vecchio。盡管還有一年多才能量產(chǎn),但它可以說是一個時代的標(biāo)志,是專為深度學(xué)習(xí)優(yōu)化的機器。
或許比全新架構(gòu)更重要的是,英特爾周日還宣布提供用于測試高性能計算的軟件工具包oneAPI的beta版,該API簡化了跨處理器及系統(tǒng)的類似超算那樣的編程。
這兩個公告都是在美國科羅拉多州博爾德舉行的第31屆高性能計算、網(wǎng)絡(luò)、存儲及分析國際大會上宣布的。
有人指出oneAPI某種意義上是Raja Koduri多年來完成的工作的一種延續(xù),Raja Koduri對此表示贊同,他說AMD擁有首個用于通用計算的GPU硬件—;—;它被稱為GPGPU,這比NVIDIA還早了兩年,但“我們那時候不是從軟件開始的”,這讓NVIDIA的CUDA編程工具包有了席卷整個行業(yè)的機會。
相比之下,在英特爾公司,“我說我們這次使用完全不同的方式,首先從軟件開始?!?/p>
Raja Koduri指出,“在過去的18個月中,我們已經(jīng)有1000多名工程師付出了巨大的努力?!?/p>
當(dāng)然,對英特爾來說,(oneAPI的)挑戰(zhàn)在于它不像NVIDIA那樣只出售一種GPU芯片,英特爾有著各種不一樣的處理器,包括至強、Ponte Vecchio及未來的GPU、Mobileye自駕芯片、Movidius視覺計算芯片、Agilex FPGA芯片及Nervana神經(jīng)網(wǎng)絡(luò)芯片。
Raja Koduri之前在AMD工作時,他講過一個比喻,廠商提供的芯片好比餐廳,英特爾提供的實際上是自助餐,種類繁多,但所有人需要的就是漢堡、奶昔這樣的簡單產(chǎn)品,后者正是NVIDAI提供的。
Raja Koduri表示要為英特爾的客戶提供便利依然面臨著同樣的挑戰(zhàn),Raja Koduri稱“我們的客戶不想跟(復(fù)雜的)異構(gòu)運算打交道”,“這就是為什么oneAPI可以在運行在抽象層的原因”,CPU是英特爾歷史上唯一一種大規(guī)模通用平臺架構(gòu),oneAPI旨在成為橋梁,以同樣的方式實現(xiàn)大規(guī)模的異構(gòu)運算。
當(dāng)被問到英特爾是否對客戶可以充分利用oneAPI及所有芯片充滿信心時,Raja Koduri表示“這是一個好問題?!?/p>
“我們提供分析事物的工具,甚至在客戶移植代碼之前就能告訴他們這些代碼是否會在GPU上高效運行,這些工具可以使得人們更容易部署硬件,是否對他們的數(shù)據(jù)中心有益也能很快想到結(jié)果。”
Raja Koduri稱Ponte Vecchio GPU芯片將采用英特爾的7nm工藝生產(chǎn),距離量產(chǎn)還有一年多的時間。
Ponte Vecchio將成為美國Aurora極光超算的一部分,這是一套價值50億美元的超算,預(yù)計會安裝在美國伊利諾伊州的阿貢國家實驗室,由美國超算廠商Cray及其他供應(yīng)商一起建造。
Raja Koduri拒絕透露有關(guān)此GPU與其他廠商的GPU架構(gòu)的不同細節(jié),他強調(diào)說“該架構(gòu)有多種運行模式,與當(dāng)前其他架構(gòu)的GPU相比更具靈活性,可以映射更多的工作負載,同時在這個新架構(gòu)上英特爾還有全新的矢量處理方法。”
Raja Koduri稱目前還沒有公布一些細節(jié),簡單來說就是英特爾在這個GPU芯片的晶體管上針對HPC做了優(yōu)化。當(dāng)被問到是否在Ponte Vecchio GPU上取消了傳統(tǒng)GPU的一些單元,比如著色器、內(nèi)存一致,Raja Koduri表示英特爾的選擇是優(yōu)化支持現(xiàn)有軟件,以便維護現(xiàn)已安裝的GPU編程的價值,但是英特爾也作出了選擇,刪除那些HPC運算不需要的東西。