Raja Koduri采訪:GPU計(jì)算夙愿在英特爾實(shí)現(xiàn) oneAPI一統(tǒng)異構(gòu)運(yùn)算
除了i740曇花一現(xiàn)的獨(dú)顯之外,英特爾似乎并不是GPU市場的主角,但在GPU計(jì)算歷史上,英特爾一直不曾缺席,現(xiàn)在英特爾終于站到舞臺(tái)中央了。
在前幾天的SC 19大會(huì)上,英特爾高級(jí)副總裁、首席架構(gòu)師以及架構(gòu)、圖形與軟件部門總經(jīng)理Raja Koduri正式宣布了面向HPC高性能計(jì)算的英特爾的Xe架構(gòu)GPU—;—;Ponte Vecchio,這是英特爾首款7nm芯片,也會(huì)用上Foveros 3D、EMIB(嵌入式多芯片互連橋接)等先進(jìn)封裝技術(shù),是英特爾HPC產(chǎn)品的集大成者。
在這個(gè)產(chǎn)品背后,英特爾及Raja Koduri到底有著怎樣的野心?美國ZDNET網(wǎng)站日前刊發(fā)了對(duì)Raja Koduri的一篇介紹,談到了英特爾在GPU計(jì)算上的宏偉愿景。
以下是ZDNET全文內(nèi)容:
我們正處于高性能計(jì)算的轉(zhuǎn)折點(diǎn)—;—;Raja Koduri
十四年前,Raja Koduri幫助開啟了GPU計(jì)算時(shí)代,這比NVIDIA創(chuàng)始人黃仁勛談?wù)摚℅PU計(jì)算)甚至還要早一年,這個(gè)想法就是—;—;GPU不僅可以用于完成流暢的視頻游戲渲染,還可以處理科學(xué)問題。
如今這個(gè)愿景已經(jīng)成為現(xiàn)實(shí),因?yàn)镚PU成為了AI人工智能及越來越多的高性能計(jì)算的主力軍。
Raja Koduri當(dāng)時(shí)在AMD公司工作,如今他成為了英特爾的首席架構(gòu)師,他坐下來跟ZDNET一起討論了GPU計(jì)算是如何不斷革命的。
Raja Koduri說,“我們正處于高性能計(jì)算的轉(zhuǎn)折點(diǎn)上?!?二十年前,HPC高性能計(jì)算被垂直集成的架構(gòu)所主導(dǎo),但是之后,商業(yè)化的X86處理器在開源軟件及各種庫文件擴(kuò)展接管了HPC計(jì)算,現(xiàn)在不只是HPC,所有集群都變成了X86及大量軟件主導(dǎo)。
Raja Koduri表示這種軟件運(yùn)動(dòng)正在主導(dǎo)新的計(jì)算時(shí)代,它可以被重新編程,像超級(jí)計(jì)算機(jī)一樣強(qiáng)大。
“在AI及異構(gòu)驅(qū)動(dòng)非線性增長的情況下,我們將看到下一次周期?!?/p>
在Raja Koduri作出如上表態(tài)的同時(shí),英特爾在周日宣布了新的GPU,它專門為HPC高性能計(jì)算而設(shè)計(jì),代號(hào)為Ponte Vecchio。盡管還有一年多才能量產(chǎn),但它可以說是一個(gè)時(shí)代的標(biāo)志,是專為深度學(xué)習(xí)優(yōu)化的機(jī)器。
或許比全新架構(gòu)更重要的是,英特爾周日還宣布提供用于測(cè)試高性能計(jì)算的軟件工具包oneAPI的beta版,該API簡化了跨處理器及系統(tǒng)的類似超算那樣的編程。
這兩個(gè)公告都是在美國科羅拉多州博爾德舉行的第31屆高性能計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)及分析國際大會(huì)上宣布的。
有人指出oneAPI某種意義上是Raja Koduri多年來完成的工作的一種延續(xù),Raja Koduri對(duì)此表示贊同,他說AMD擁有首個(gè)用于通用計(jì)算的GPU硬件—;—;它被稱為GPGPU,這比NVIDIA還早了兩年,但“我們那時(shí)候不是從軟件開始的”,這讓NVIDIA的CUDA編程工具包有了席卷整個(gè)行業(yè)的機(jī)會(huì)。
相比之下,在英特爾公司,“我說我們這次使用完全不同的方式,首先從軟件開始?!?/p>
Raja Koduri指出,“在過去的18個(gè)月中,我們已經(jīng)有1000多名工程師付出了巨大的努力。”
當(dāng)然,對(duì)英特爾來說,(oneAPI的)挑戰(zhàn)在于它不像NVIDIA那樣只出售一種GPU芯片,英特爾有著各種不一樣的處理器,包括至強(qiáng)、Ponte Vecchio及未來的GPU、Mobileye自駕芯片、Movidius視覺計(jì)算芯片、Agilex FPGA芯片及Nervana神經(jīng)網(wǎng)絡(luò)芯片。
Raja Koduri之前在AMD工作時(shí),他講過一個(gè)比喻,廠商提供的芯片好比餐廳,英特爾提供的實(shí)際上是自助餐,種類繁多,但所有人需要的就是漢堡、奶昔這樣的簡單產(chǎn)品,后者正是NVIDAI提供的。
Raja Koduri表示要為英特爾的客戶提供便利依然面臨著同樣的挑戰(zhàn),Raja Koduri稱“我們的客戶不想跟(復(fù)雜的)異構(gòu)運(yùn)算打交道”,“這就是為什么oneAPI可以在運(yùn)行在抽象層的原因”,CPU是英特爾歷史上唯一一種大規(guī)模通用平臺(tái)架構(gòu),oneAPI旨在成為橋梁,以同樣的方式實(shí)現(xiàn)大規(guī)模的異構(gòu)運(yùn)算。
當(dāng)被問到英特爾是否對(duì)客戶可以充分利用oneAPI及所有芯片充滿信心時(shí),Raja Koduri表示“這是一個(gè)好問題?!?/p>
“我們提供分析事物的工具,甚至在客戶移植代碼之前就能告訴他們這些代碼是否會(huì)在GPU上高效運(yùn)行,這些工具可以使得人們更容易部署硬件,是否對(duì)他們的數(shù)據(jù)中心有益也能很快想到結(jié)果?!?/p>
Raja Koduri稱Ponte Vecchio GPU芯片將采用英特爾的7nm工藝生產(chǎn),距離量產(chǎn)還有一年多的時(shí)間。
Ponte Vecchio將成為美國Aurora極光超算的一部分,這是一套價(jià)值50億美元的超算,預(yù)計(jì)會(huì)安裝在美國伊利諾伊州的阿貢國家實(shí)驗(yàn)室,由美國超算廠商Cray及其他供應(yīng)商一起建造。
Raja Koduri拒絕透露有關(guān)此GPU與其他廠商的GPU架構(gòu)的不同細(xì)節(jié),他強(qiáng)調(diào)說“該架構(gòu)有多種運(yùn)行模式,與當(dāng)前其他架構(gòu)的GPU相比更具靈活性,可以映射更多的工作負(fù)載,同時(shí)在這個(gè)新架構(gòu)上英特爾還有全新的矢量處理方法。”
Raja Koduri稱目前還沒有公布一些細(xì)節(jié),簡單來說就是英特爾在這個(gè)GPU芯片的晶體管上針對(duì)HPC做了優(yōu)化。當(dāng)被問到是否在Ponte Vecchio GPU上取消了傳統(tǒng)GPU的一些單元,比如著色器、內(nèi)存一致,Raja Koduri表示英特爾的選擇是優(yōu)化支持現(xiàn)有軟件,以便維護(hù)現(xiàn)已安裝的GPU編程的價(jià)值,但是英特爾也作出了選擇,刪除那些HPC運(yùn)算不需要的東西。