賽靈思:下一代數(shù)據(jù)中心將會注重可組合性
“摩爾定律放緩”甚至激進(jìn)派的”摩爾定律已死”這種說法自從十幾年前就廣為“傳頌”,面對這種瓶頸,主流廠商所走的路一條是異構(gòu)計(jì)算,另一條則是“小芯片”或名為“芯粒”(Chiplet)。由此,數(shù)據(jù)中心所引發(fā)的新一輪計(jì)算革命掀起。
事實(shí)上,觀察行業(yè)巨頭“小芯片”的行徑,最終走向總歸是組合化的?!靶⌒酒闭且?yàn)橄翊罘e木一樣,將預(yù)設(shè)特定功能芯片裸片進(jìn)行封裝復(fù)用以構(gòu)建新IP,這種集成系統(tǒng)能夠成為一種新型“超異構(gòu)系統(tǒng)”,這種靈活性不失為延續(xù)摩爾定律的“組合拳”。
這種組合式的思路不僅適合于芯片發(fā)展,同樣也適用于數(shù)據(jù)中心?!拔覀兿嘈畔乱淮臄?shù)據(jù)中心,會對組合性有非常高的要求,從基礎(chǔ)設(shè)施一直到器件這個層面,都會要求可組合性”,日前,賽靈思(Xilinx)數(shù)據(jù)中心事業(yè)部網(wǎng)絡(luò)與存儲產(chǎn)品管理總監(jiān)Kartik Srinivasan在賽靈思的2021春季新品發(fā)布會上如是說,圍繞可組合性數(shù)據(jù)中心也推出了三個具體的解決方案。
可組合的SmartNIC
去年三月同期,賽靈思宣布推出業(yè)界首款一體化SmartNIC平臺Alveo U25,旨在卸載數(shù)據(jù)中心內(nèi)部橫向流量的問題,防止擠占CPU資源。彼時該款產(chǎn)品擁有2個25Gb以太網(wǎng)端口,且是ZYNQ級器件,擁有超過52萬+LUT。
今年三月,賽靈思繼續(xù)推出Alveo SN1000(下文簡稱SN1000),這是業(yè)界首款硬件可組合式SmartNIC。該款產(chǎn)品最大的亮點(diǎn)是其可組合性,支撐SN1000的是三個堅(jiān)實(shí)的“地基”:
其一,SN1000基于UltraScale+ FPGA架構(gòu),擁有賽靈思FPGA的靈活應(yīng)變能力,是保障其性能的“底氣”;其二,擁有控制面與數(shù)據(jù)面分離的特性,是賦能硬件可組合的充要條件;其三,擁有vitis Networking軟件,讓用戶充分利用可組合式功能,進(jìn)行軟件定義硬件加速,軟件不僅支持P4高級語言編程,也支持C/C++對Arm進(jìn)行控制和流量管理。
在參數(shù)上,以太網(wǎng)端口升級成2個100Gb,擁有1M LUT、2x QSFP28的封裝尺寸和75W的低功耗,搭載核Arm SoC的NXP LX2162 16-core A72。
Kartik Srinivasan為記者介紹,SN1000是一款開箱即用且即插即用的產(chǎn)品,其背后的秘訣是賽靈思預(yù)先對硬件進(jìn)行了OVS加速、網(wǎng)絡(luò)虛擬化安全加速和存儲加速等。
對于其重點(diǎn)可組合性上,Kartik Srinivasan介紹表示,SN1000支持客戶根據(jù)不同要求進(jìn)行靈活組合和加速,這歸功于內(nèi)存既支持?jǐn)?shù)據(jù)面也支持控制面,通過這樣的雙向支持能夠讓數(shù)據(jù)面實(shí)現(xiàn)管理和加速,在控制面實(shí)現(xiàn)ARM的CPU進(jìn)行加速,以達(dá)到高效便捷的安全分離和遷移,是行業(yè)積極擁抱異構(gòu)計(jì)算的典范。
專家預(yù)測2024年可編程的SmartNIC將占市場的70%,那么以FPGA為核心的SmartNIC有什么不同?Kartik Srinivasan表示,從傳統(tǒng)或標(biāo)準(zhǔn)的NIC到卸載NIC再到可編程SmartNIC,最早采用SmartNIC技術(shù)的是超大規(guī)模的數(shù)據(jù)中心和云服務(wù)提供商,包括百度、阿里、騰訊,這些提供商在快節(jié)奏的變革和多樣化網(wǎng)絡(luò)功能中,擁有很多要求,特別是線速性能的數(shù)據(jù)包處理方面,以實(shí)現(xiàn)加速網(wǎng)絡(luò)、安全和存儲卸載這三個功能。
SmartNIC主要包括FPGA、ASIC、CPU/SoC三種,但ASIC的實(shí)現(xiàn)方案缺乏定制能力,很難跟上每間隔12-18個月就產(chǎn)生很大變化的速度演進(jìn),CPU/SoC又難以實(shí)現(xiàn)硬件加速的要求和性能。因此,FPGA的靈活性和強(qiáng)大的加速能力成為了首選。
在SN1000這一“萌新降生”后,目前Xilinx在NIC系列上擁有X2、U25、SN1000三個平臺,分別應(yīng)對不同對場景和供客戶選擇。
可組合的AI視頻分析
本次發(fā)布會,賽靈思還發(fā)布了賽靈思智能世界視頻分析平臺Xilinx Smart World,之所以發(fā)力這一方面是AI視頻分析對時延和算法復(fù)雜性擁有極高要求,諸如口罩檢測、人員計(jì)數(shù)、病患監(jiān)控、工業(yè)安全、零售分析、門禁控制等方面均有強(qiáng)勁需求。
根據(jù)賽靈思數(shù)據(jù)中心部亞太區(qū)數(shù)據(jù)中心戰(zhàn)略營銷經(jīng)理Guruprasad M. Parthasarathy的介紹,該解決方案著重兩個關(guān)注點(diǎn):其一,去掉FPGA硬件開發(fā),客戶只需相關(guān)應(yīng)用開發(fā)即可;其二,賽靈思聯(lián)合生態(tài)合作伙伴提供了隨時可部署的視頻分析解決方案,方案支持智慧城市、智能醫(yī)療、智能零售等重要領(lǐng)域部署。
賽靈思智能世界堅(jiān)實(shí)的后盾是其Alveo器件系列,方案擁有兩個優(yōu)勢:其一,擁有總擁有成本(TCO)優(yōu)勢,據(jù)Guruprasad介紹,與其競品英偉達(dá)T4 GPU相比,能夠降低30%的總擁有成本;其二,擁有時延優(yōu)勢,與其競品英偉達(dá)T4 GPU相比能夠在16流上提速77%,32流上提供71%。
值得一提的是,賽靈思智能世界應(yīng)用將可在VMSS平臺上直接進(jìn)行應(yīng)用的開發(fā),這是一個高度可擴(kuò)展的平臺,該平臺不僅擁有極低的時延,還擁有極強(qiáng)的擴(kuò)展性,在機(jī)器學(xué)習(xí)和人工智能算法復(fù)雜性增時也可同時并行多種模型和算法,不會影響端到端的性能。
Guruprasad表示,平臺擁有許多合作伙伴,包括Mipsology、deepAI、Aupera,這些伙伴開發(fā)的視頻解決方案能夠成功幫助客戶應(yīng)用搭建,并且各個伙伴的視頻解決方案各具特色,可供客戶按需選取。
Guruprasad列舉了騰訊WeLink的智能樓用例,該方案采用了合作伙伴的Aupera的解決方案,采用方案之前視頻流和互聯(lián)網(wǎng)數(shù)據(jù)都會放騰訊云匯總進(jìn)行處理,這不僅擁有極高的成本也過度消耗了云計(jì)算。在采用Aupera方案后,實(shí)現(xiàn)在本地邊緣推斷,大大降低了時延,同時使得帶寬的成本降低了90%,目前方案已成功部署5000個攝像頭,實(shí)現(xiàn)了人臉識別、口罩檢測等功能。
通過該方案可以看出,賽靈思智能世界的核心是開箱即用和即插即用,賽靈思正在賦能Alveo加速卡在應(yīng)用層面的可組合,以充分發(fā)揮其成本和低時延特性。
賽靈思加速算法交易
賽靈思還推出了賽靈思加速算法交易,這一解決方案的核心概念也是開箱即用和即插即用,即在應(yīng)用開發(fā)上的可組合。不過賽靈思智能世界聚焦的是AI視頻分析,賽靈思加速算法交易則著重“算法交易”或“HFT高頻交易”領(lǐng)域。
據(jù)賽靈思數(shù)據(jù)中心市場營銷總監(jiān)Ed Wright介紹,當(dāng)今的算法交易其實(shí)主要存在硬件算法交易和軟件算法交易兩種,二者在能力和性能上擁有重大鴻溝,且軟件算法交易如若想轉(zhuǎn)換成硬件算法交易的門檻是極高的,需要專門的硬件開發(fā)商在IT進(jìn)行架構(gòu)和設(shè)計(jì)。這樣勢必?fù)碛袠O高的成本和極長的交付期,伴隨而來的風(fēng)險是極高的。
賽靈思加速算法交易便可在無需硬件開發(fā)情況下,實(shí)現(xiàn)非常復(fù)雜的策略,且讓交易者能以少于微秒(sub-microsecond)的時延實(shí)施先進(jìn)策略。
Ed Wright表示,在賽靈思的vitis平臺上,開發(fā)者可用模塊化的方式構(gòu)建部署基于FPGA的Alveo加速卡,平臺不僅支持庫的自由組合,還支持非常廣泛的算法交易用力,在此層級上可繼續(xù)部署算法交易的框架和IP。
在算法交易市場上,之前多是CPU驅(qū)動,但相比FPGA使用CPU仍然擁有較長的交付期和較高的成本。值得一提的是,CPU驅(qū)動的算法交易缺乏市場競爭,在FPGA突入這樣的市場空白之下,既能夠縮短上市時間還能提供強(qiáng)力有力的競爭。
賽靈思加速算法交易適用于經(jīng)紀(jì)人、交易所、市場數(shù)據(jù)廠商、銷售側(cè)廠商、自營交易商等不同機(jī)構(gòu)用戶,能夠?yàn)槠涮峁┧惴ㄥ漠?、智能訂單路由、市場?shù)據(jù)門戶、FIX門戶、進(jìn)行交易、交易前風(fēng)險、會場數(shù)據(jù)加速器等服務(wù)。
部署賽靈思加速算法交易也非常便捷,只需通過賽靈思渠道的經(jīng)銷商和分銷商購置Alveo U50或Alveo U250,從Xilinx.com下載開源算法,無需任何許可證費(fèi)用即可立即使用賽靈思加速算法交易。
總結(jié)
在可組合上,本次賽靈思2021年春季發(fā)布推出了Alveo SN1000 SmartNIC、賽靈思智能世界、賽靈思加速算法交易三款可組合式數(shù)據(jù)中心平臺產(chǎn)品,聚焦于軟件定義和硬件加速。
除此之外,Xilinx App Store也一并被發(fā)布,根據(jù)Ed Wright的介紹,該應(yīng)用商店不僅能夠方便地消費(fèi)選擇應(yīng)用,還能方便地將方案推給客戶,預(yù)計(jì)賽靈思應(yīng)用商店將成為客戶優(yōu)選的購買和部署加速應(yīng)用的新方式。
在可組合概念逐漸深化之下,行業(yè)掀起一股新的浪潮,賽靈思的三款平臺產(chǎn)品也拉開了可組合性數(shù)據(jù)的序幕。通過賽靈思的部署來看,三款新平臺的核心除了可組合,還聚焦了開箱即用和即插即用這一概念。彼時,F(xiàn)PGA開發(fā)因其入門難度抵擋了許多開發(fā)者的腳步,賽靈思著重降低硬件開發(fā)的比重,從而讓開發(fā)應(yīng)用成為“主戰(zhàn)場”。
記者認(rèn)為,當(dāng)FPGA普適于不同層級的開發(fā)者,開發(fā)重點(diǎn)愈發(fā)趨向應(yīng)用本身,FPGA的低延時、高性能、靈活性和總擁有成本的優(yōu)勢將逐漸填補(bǔ)傳統(tǒng)計(jì)算領(lǐng)域空白,使得開發(fā)者有更廣的選擇空間。