有DPU了,為什么英特爾還要出IPU?
數(shù)據(jù)量跨越式增長(zhǎng)時(shí)代下,許多額外的工作涌入云數(shù)據(jù)中心服務(wù)器,而其中存在并非應(yīng)用級(jí)的處理,僅僅是將數(shù)據(jù)包進(jìn)行傳輸處理。這些工作會(huì)擠占CPU資源,將大量CPU處理能力耗費(fèi)在應(yīng)用之外。因此,SmartNIC(智能設(shè)備)就誕生了,為了卸載被擠占的網(wǎng)絡(luò)、存儲(chǔ)和計(jì)算資源。
一些廠(chǎng)商堅(jiān)定站隊(duì)FPGA,將FPGA的SmartNIC做到了一體化,一張卡實(shí)現(xiàn)網(wǎng)絡(luò)、存儲(chǔ)和計(jì)算加速融合。一些廠(chǎng)商則重新定義DPU(數(shù)據(jù)處理芯片),解決服務(wù)器數(shù)據(jù)交換效率低、數(shù)據(jù)傳輸可靠性低、數(shù)據(jù)中心模型執(zhí)行效率低、I/O切換效率低、服務(wù)器架構(gòu)不靈活以及網(wǎng)絡(luò)不安全的問(wèn)題。
英特爾則重新定義這種技術(shù)為IPU((InfrastructureProcessingUnit,基礎(chǔ)設(shè)施芯片),“在大多數(shù)情況下,IPU從財(cái)務(wù)角度來(lái)說(shuō)對(duì)于云服務(wù)提供商極具吸引力”,Guido Appenzeller英特爾公司數(shù)據(jù)平臺(tái)事業(yè)部首席技術(shù)官如是說(shuō)。
為什么偏偏是IPU
在介紹IPU之前仍需探求根源,既然業(yè)界已經(jīng)存在了SmartNIC,英特爾為什么要做IPU?Guido告訴記者,從術(shù)語(yǔ)上來(lái)看,IPU相比SmartNIC具有本地控制平面。這意味著,IPU在本質(zhì)上是可以控制CPU的,當(dāng)CPU想在網(wǎng)絡(luò)上發(fā)送數(shù)據(jù)包時(shí),IPU將確保此數(shù)據(jù)包位于特定的虛擬覆蓋網(wǎng)絡(luò)上,由IPU控制PCI總線(xiàn),將虛擬設(shè)備展示給CPU。SmartNIC更偏向卸載,一切都由CPU編程,CPU將會(huì)管理這一切的加速流程。
另外,一些企業(yè)命名DPU,為什么英特爾要叫IPU?根據(jù)Guido的分析,二者最終的目的是相同的,但I(xiàn)PU的作用是處理基礎(chǔ)設(shè)施功能,這是與眾不同之處,而DPU的命名將范圍縮小到“數(shù)據(jù)”這一范圍,反而并不是非常準(zhǔn)確的描述。
實(shí)際上,英特爾的IPU不僅在命名上更加清晰,在整體產(chǎn)品線(xiàn)上也非常清晰,非常貼合英特爾自身的IDM優(yōu)勢(shì)。
英特爾官方將IPU定義為一種可編程網(wǎng)絡(luò)設(shè)備,旨在使云和通信服務(wù)提供商減少在中央處理器(CPU)方面的開(kāi)銷(xiāo),并充分釋放性能價(jià)值,它能夠?qū)?shù)據(jù)中心內(nèi)的基礎(chǔ)設(shè)施功能進(jìn)行安全加速,從而使系統(tǒng)級(jí)資源的管理更加智能。利用IPU,客戶(hù)能夠部署安全穩(wěn)定且可編程的解決方案,從而更好地利用資源,平衡數(shù)據(jù)處理與存儲(chǔ)的工作負(fù)載。
換言之,過(guò)去軟件都在相同的芯片上運(yùn)行,現(xiàn)在把不同任務(wù)分開(kāi)到IPU和CPU兩種芯片上運(yùn)行。Guido為記者舉了一個(gè)非常易懂的例子:“這有點(diǎn)像家和酒店的區(qū)別,在家中,客廳、廚房、餐桌都在一個(gè)大區(qū)域內(nèi),可以方便地從一個(gè)地方移步到另一個(gè)地方。但在酒店中,客房和餐廳是分開(kāi)的,客房?jī)?nèi)沒(méi)有廚房,而作為客人的也不會(huì)進(jìn)入廚房。我在餐廳吃飯,而廚師在廚房中工作。酒店客人和工作人員是分開(kāi)的。數(shù)據(jù)中心也是這樣的發(fā)展趨勢(shì),運(yùn)行租戶(hù)工作負(fù)載的芯片和運(yùn)行云服務(wù)提供商的軟件的芯片正在逐步分離?!?
而具體從優(yōu)勢(shì)上來(lái)說(shuō),IPU擁有三大優(yōu)點(diǎn):
1、IPU充當(dāng)服務(wù)器的控制面。這意味著它運(yùn)行的是云服務(wù)提供商的軟件,可以保護(hù)、控制CPU或?qū)⑵溥M(jìn)行隔離。
2、IPU針對(duì)基礎(chǔ)設(shè)施功能進(jìn)行了優(yōu)化,效率極高。
3、可以過(guò)渡到無(wú)磁盤(pán)架構(gòu)。“IPU非常聰明的地方在于,存儲(chǔ)服務(wù)器和服務(wù)器上的工作負(fù)載之間的實(shí)際存儲(chǔ)流量是在高速路徑上進(jìn)行的,這意味著不會(huì)涉及IPU或CPU上的任何CPU內(nèi)核”,Guido這樣為記者介紹。
IPU的兩種實(shí)現(xiàn)形式
英特爾是業(yè)界唯一擁有CPU、獨(dú)立GPU、ASIC、FPGA、各種加速器的企業(yè),因此從實(shí)現(xiàn)來(lái)說(shuō),英特爾也非常貼合自己的優(yōu)勢(shì),分成了兩類(lèi)。一類(lèi)是ASIC IPU,另一類(lèi)是基于FPGAIPU。在2021年的架構(gòu)日上,英特爾發(fā)布了全新的IPU架構(gòu)產(chǎn)品,也包含了一款非IPU的智能網(wǎng)卡。
1、ASIC IPU
據(jù)Guido介紹,MountEvans是英特爾的首個(gè)ASICIPU。MountEvans是與一家頂級(jí)云服務(wù)提供商共同設(shè)計(jì)和開(kāi)發(fā)的,它融合了多代FPGASmartNIC的經(jīng)驗(yàn)。
Guido為記者介紹了這款產(chǎn)品的強(qiáng)大之處,MoutnEvans支持200Gb/s的吞吐量,能夠最多四個(gè)至強(qiáng)主機(jī)連接起來(lái)。英特爾意識(shí)到云對(duì)性能的需求,將推動(dòng)存儲(chǔ)、消息處理和高性能計(jì)算等很多應(yīng)用遷移到基于RDMA的協(xié)議上,通過(guò)實(shí)現(xiàn)ROCEv2以及我早前提到的全新可靠傳輸技術(shù),英特爾可以輕松完成這種遷移。另外,Mount.Evans提供InlineIPSec,以保護(hù)網(wǎng)絡(luò)上發(fā)送的每一個(gè)數(shù)據(jù)包。
尤為引起注意的是,其上的計(jì)算復(fù)合體是基于A(yíng)RMNeoverse架構(gòu)的N1Ares內(nèi)核。這16個(gè)高頻率內(nèi)核附帶由三個(gè)LPDDR4控制器支持的大型系統(tǒng)級(jí)緩存。這個(gè)計(jì)算復(fù)合體與網(wǎng)絡(luò)子系統(tǒng)密切結(jié)合,使得網(wǎng)絡(luò)子系統(tǒng)加速器能夠把系統(tǒng)級(jí)緩存用作最后一級(jí)緩存,以及提供兩者之間高帶寬、低時(shí)延連接;并能夠靈活地整合硬件和軟件數(shù)據(jù)包處理。
當(dāng)然,這一IPU還吸收了至強(qiáng)處理器的優(yōu)勢(shì),Lookaside加密與壓縮引擎源作為英特爾的QuickAssist技術(shù),IPU針對(duì)使用模式對(duì)其進(jìn)行了修改,其中包括對(duì)Zstandard壓縮算法的支持。
2、FPGA IPU
據(jù)Guido介紹,OakSpringsCanyon是一個(gè)IPU參考平臺(tái),基于英特爾®至強(qiáng)D處理器(Intel®Xeon-D)和擁有業(yè)界領(lǐng)先的功率、效率、性能的英特爾®Agilex?FPGA構(gòu)建。Guido非常自豪地為記者說(shuō):“我們對(duì)這款產(chǎn)品非常有信心,它適用于超大規(guī)模云部署。”
具體來(lái)說(shuō),OaksSpringsCanyon是一個(gè)基于FPGA的IPU,其中采用了英特爾的AgilexFPGA和Xeon-D片上系統(tǒng)。值得一提的是,AgilexFPGA擁有業(yè)界領(lǐng)先的功率、效率和性能,搭配至強(qiáng)服務(wù)器,提供卸載2x100G工作負(fù)載所需的性能以及專(zhuān)為x86優(yōu)化的豐富軟件生態(tài)系統(tǒng)。
OakSpringsCanyon采用了英特爾®開(kāi)放式FPGA開(kāi)發(fā)堆棧(英特爾®OFS),這是一個(gè)可擴(kuò)展、開(kāi)源軟硬件基礎(chǔ)設(shè)施堆棧。OakSpringsCanyon能夠滿(mǎn)足新興云服務(wù)提供商對(duì)于部署100GB工作負(fù)載的需求。
3、SmartNIC
除了IPU,英特爾還發(fā)布了一個(gè)非IPU的產(chǎn)品,稱(chēng)之為智能網(wǎng)卡。即英特爾N6000加速開(kāi)發(fā)平臺(tái),代號(hào)為“ArrowCreek”,這款產(chǎn)品也是基于FPGA的。
Guido為記者介紹,ArrowCreek沒(méi)有CPU,是一個(gè)基于A(yíng)gilex FPGA和e810 100GB以太網(wǎng)控制器的加速開(kāi)發(fā)平臺(tái),并不能用作IPU。這款產(chǎn)品更多地用于通信服務(wù)場(chǎng)景。
IPU未來(lái)將走向何方
從產(chǎn)品中,能夠看到英特爾將產(chǎn)品分為ASIC和FPGA兩類(lèi)。根據(jù)Guido的解釋?zhuān)現(xiàn)PGA對(duì)比ASIC有各自的優(yōu)劣勢(shì)。
“如果FPGA帶來(lái)最大的靈活性。如果你希望實(shí)施一個(gè)特別的算法,就可以用FPGA。這對(duì)于很多云來(lái)說(shuō)很重要,因?yàn)槟壳芭琶鞍说脑迫际褂貌煌膶?zhuān)有存儲(chǔ)協(xié)議。如果是只有您使用的專(zhuān)有協(xié)議,那么選擇FPGA是合理的,因?yàn)閷?zhuān)用芯片很明顯不支持這種做法。而FPGA的一個(gè)劣勢(shì)是,它們很難編程。因此,您需要一個(gè)相當(dāng)強(qiáng)大的團(tuán)隊(duì)。吞吐量、功耗在一定程度上受到限制。我們認(rèn)為,隨著帶寬變高,趨勢(shì)是使用更專(zhuān)用的ASIC IPU”,他這樣為記者分析。
簡(jiǎn)言之,想要最高的靈活性就使用FPGA IPU,想要更高的帶寬并且擁有專(zhuān)用的協(xié)議就使用ASIC IPU。不過(guò)Guido認(rèn)為,絕大多數(shù)云未來(lái)會(huì)更加偏向使用ASICIPU。
業(yè)界擁有一些廠(chǎng)商在整合IPU和GPU以及其他器件,Guido認(rèn)為,目前不確定英特爾會(huì)不會(huì)這么做。他表示,對(duì)于英特爾來(lái)說(shuō),特別是在云上,云服務(wù)提供商最感興趣的是同類(lèi)最佳的單用途設(shè)備,所以可能選擇IPU來(lái)搭配圖形加速器,也可選擇IPU搭配AI加速器,或者選擇IPU搭配CPU,但基本上專(zhuān)用的系統(tǒng)。所以未來(lái)可能將是IPU和其他種類(lèi)加速器結(jié)合的趨勢(shì)。
從整體市場(chǎng)來(lái)看,Guido表示,IPU或是DPU已成為一些創(chuàng)業(yè)公司的熱門(mén)方向,有幾家創(chuàng)業(yè)公司正在開(kāi)發(fā)該領(lǐng)域的技術(shù),且擁有許多有趣的技術(shù)和有趣的產(chǎn)品,這對(duì)所有廠(chǎng)商來(lái)說(shuō)都是非常有益的。同樣,英特爾也對(duì)自身所處的市場(chǎng)地位非常滿(mǎn)意,他認(rèn)為這將是一個(gè)大市場(chǎng)。從長(zhǎng)遠(yuǎn)來(lái)看,云端的幾乎每個(gè)服務(wù)器都會(huì)有類(lèi)似IPU的東西。
“這顯然是一個(gè)很大的市場(chǎng)。漸漸地,這不再是一個(gè)初創(chuàng)市場(chǎng),而是一個(gè)由大公司主導(dǎo)的市場(chǎng)”,Guido如是說(shuō)。