賽靈思:下一代數(shù)據(jù)中心將會注重可組合性
“摩爾定律放緩”甚至激進派的”摩爾定律已死”這種說法自從十幾年前就廣為“傳頌”,面對這種瓶頸,主流廠商所走的路一條是異構計算,另一條則是“小芯片”或名為“芯?!保–hiplet)。由此,數(shù)據(jù)中心所引發(fā)的新一輪計算革命掀起。
事實上,觀察行業(yè)巨頭“小芯片”的行徑,最終走向總歸是組合化的?!靶⌒酒闭且驗橄翊罘e木一樣,將預設特定功能芯片裸片進行封裝復用以構建新IP,這種集成系統(tǒng)能夠成為一種新型“超異構系統(tǒng)”,這種靈活性不失為延續(xù)摩爾定律的“組合拳”。
這種組合式的思路不僅適合于芯片發(fā)展,同樣也適用于數(shù)據(jù)中心。“我們相信下一代的數(shù)據(jù)中心,會對組合性有非常高的要求,從基礎設施一直到器件這個層面,都會要求可組合性”,日前,賽靈思(Xilinx)數(shù)據(jù)中心事業(yè)部網(wǎng)絡與存儲產(chǎn)品管理總監(jiān)Kartik Srinivasan在賽靈思的2021春季新品發(fā)布會上如是說,圍繞可組合性數(shù)據(jù)中心也推出了三個具體的解決方案。
可組合的SmartNIC
去年三月同期,賽靈思宣布推出業(yè)界首款一體化SmartNIC平臺Alveo U25,旨在卸載數(shù)據(jù)中心內部橫向流量的問題,防止擠占CPU資源。彼時該款產(chǎn)品擁有2個25Gb以太網(wǎng)端口,且是ZYNQ級器件,擁有超過52萬+LUT。
今年三月,賽靈思繼續(xù)推出Alveo SN1000(下文簡稱SN1000),這是業(yè)界首款硬件可組合式SmartNIC。該款產(chǎn)品最大的亮點是其可組合性,支撐SN1000的是三個堅實的“地基”:
其一,SN1000基于UltraScale+ FPGA架構,擁有賽靈思FPGA的靈活應變能力,是保障其性能的“底氣”;其二,擁有控制面與數(shù)據(jù)面分離的特性,是賦能硬件可組合的充要條件;其三,擁有vitis Networking軟件,讓用戶充分利用可組合式功能,進行軟件定義硬件加速,軟件不僅支持P4高級語言編程,也支持C/C++對Arm進行控制和流量管理。
在參數(shù)上,以太網(wǎng)端口升級成2個100Gb,擁有1M LUT、2x QSFP28的封裝尺寸和75W的低功耗,搭載核Arm SoC的NXP LX2162 16-core A72。
Kartik Srinivasan為記者介紹,SN1000是一款開箱即用且即插即用的產(chǎn)品,其背后的秘訣是賽靈思預先對硬件進行了OVS加速、網(wǎng)絡虛擬化安全加速和存儲加速等。
對于其重點可組合性上,Kartik Srinivasan介紹表示,SN1000支持客戶根據(jù)不同要求進行靈活組合和加速,這歸功于內存既支持數(shù)據(jù)面也支持控制面,通過這樣的雙向支持能夠讓數(shù)據(jù)面實現(xiàn)管理和加速,在控制面實現(xiàn)ARM的CPU進行加速,以達到高效便捷的安全分離和遷移,是行業(yè)積極擁抱異構計算的典范。
專家預測2024年可編程的SmartNIC將占市場的70%,那么以FPGA為核心的SmartNIC有什么不同?Kartik Srinivasan表示,從傳統(tǒng)或標準的NIC到卸載NIC再到可編程SmartNIC,最早采用SmartNIC技術的是超大規(guī)模的數(shù)據(jù)中心和云服務提供商,包括百度、阿里、騰訊,這些提供商在快節(jié)奏的變革和多樣化網(wǎng)絡功能中,擁有很多要求,特別是線速性能的數(shù)據(jù)包處理方面,以實現(xiàn)加速網(wǎng)絡、安全和存儲卸載這三個功能。
SmartNIC主要包括FPGA、ASIC、CPU/SoC三種,但ASIC的實現(xiàn)方案缺乏定制能力,很難跟上每間隔12-18個月就產(chǎn)生很大變化的速度演進,CPU/SoC又難以實現(xiàn)硬件加速的要求和性能。因此,FPGA的靈活性和強大的加速能力成為了首選。
在SN1000這一“萌新降生”后,目前Xilinx在NIC系列上擁有X2、U25、SN1000三個平臺,分別應對不同對場景和供客戶選擇。
可組合的AI視頻分析
本次發(fā)布會,賽靈思還發(fā)布了賽靈思智能世界視頻分析平臺Xilinx Smart World,之所以發(fā)力這一方面是AI視頻分析對時延和算法復雜性擁有極高要求,諸如口罩檢測、人員計數(shù)、病患監(jiān)控、工業(yè)安全、零售分析、門禁控制等方面均有強勁需求。
根據(jù)賽靈思數(shù)據(jù)中心部亞太區(qū)數(shù)據(jù)中心戰(zhàn)略營銷經(jīng)理Guruprasad M. Parthasarathy的介紹,該解決方案著重兩個關注點:其一,去掉FPGA硬件開發(fā),客戶只需相關應用開發(fā)即可;其二,賽靈思聯(lián)合生態(tài)合作伙伴提供了隨時可部署的視頻分析解決方案,方案支持智慧城市、智能醫(yī)療、智能零售等重要領域部署。
賽靈思智能世界堅實的后盾是其Alveo器件系列,方案擁有兩個優(yōu)勢:其一,擁有總擁有成本(TCO)優(yōu)勢,據(jù)Guruprasad介紹,與其競品英偉達T4 GPU相比,能夠降低30%的總擁有成本;其二,擁有時延優(yōu)勢,與其競品英偉達T4 GPU相比能夠在16流上提速77%,32流上提供71%。
值得一提的是,賽靈思智能世界應用將可在VMSS平臺上直接進行應用的開發(fā),這是一個高度可擴展的平臺,該平臺不僅擁有極低的時延,還擁有極強的擴展性,在機器學習和人工智能算法復雜性增時也可同時并行多種模型和算法,不會影響端到端的性能。
Guruprasad表示,平臺擁有許多合作伙伴,包括Mipsology、deepAI、Aupera,這些伙伴開發(fā)的視頻解決方案能夠成功幫助客戶應用搭建,并且各個伙伴的視頻解決方案各具特色,可供客戶按需選取。
Guruprasad列舉了騰訊WeLink的智能樓用例,該方案采用了合作伙伴的Aupera的解決方案,采用方案之前視頻流和互聯(lián)網(wǎng)數(shù)據(jù)都會放騰訊云匯總進行處理,這不僅擁有極高的成本也過度消耗了云計算。在采用Aupera方案后,實現(xiàn)在本地邊緣推斷,大大降低了時延,同時使得帶寬的成本降低了90%,目前方案已成功部署5000個攝像頭,實現(xiàn)了人臉識別、口罩檢測等功能。
通過該方案可以看出,賽靈思智能世界的核心是開箱即用和即插即用,賽靈思正在賦能Alveo加速卡在應用層面的可組合,以充分發(fā)揮其成本和低時延特性。
賽靈思加速算法交易
賽靈思還推出了賽靈思加速算法交易,這一解決方案的核心概念也是開箱即用和即插即用,即在應用開發(fā)上的可組合。不過賽靈思智能世界聚焦的是AI視頻分析,賽靈思加速算法交易則著重“算法交易”或“HFT高頻交易”領域。
據(jù)賽靈思數(shù)據(jù)中心市場營銷總監(jiān)Ed Wright介紹,當今的算法交易其實主要存在硬件算法交易和軟件算法交易兩種,二者在能力和性能上擁有重大鴻溝,且軟件算法交易如若想轉換成硬件算法交易的門檻是極高的,需要專門的硬件開發(fā)商在IT進行架構和設計。這樣勢必擁有極高的成本和極長的交付期,伴隨而來的風險是極高的。
賽靈思加速算法交易便可在無需硬件開發(fā)情況下,實現(xiàn)非常復雜的策略,且讓交易者能以少于微秒(sub-microsecond)的時延實施先進策略。
Ed Wright表示,在賽靈思的vitis平臺上,開發(fā)者可用模塊化的方式構建部署基于FPGA的Alveo加速卡,平臺不僅支持庫的自由組合,還支持非常廣泛的算法交易用力,在此層級上可繼續(xù)部署算法交易的框架和IP。
在算法交易市場上,之前多是CPU驅動,但相比FPGA使用CPU仍然擁有較長的交付期和較高的成本。值得一提的是,CPU驅動的算法交易缺乏市場競爭,在FPGA突入這樣的市場空白之下,既能夠縮短上市時間還能提供強力有力的競爭。
賽靈思加速算法交易適用于經(jīng)紀人、交易所、市場數(shù)據(jù)廠商、銷售側廠商、自營交易商等不同機構用戶,能夠為其提供算法迥異、智能訂單路由、市場數(shù)據(jù)門戶、FIX門戶、進行交易、交易前風險、會場數(shù)據(jù)加速器等服務。
部署賽靈思加速算法交易也非常便捷,只需通過賽靈思渠道的經(jīng)銷商和分銷商購置Alveo U50或Alveo U250,從Xilinx.com下載開源算法,無需任何許可證費用即可立即使用賽靈思加速算法交易。
總結
在可組合上,本次賽靈思2021年春季發(fā)布推出了Alveo SN1000 SmartNIC、賽靈思智能世界、賽靈思加速算法交易三款可組合式數(shù)據(jù)中心平臺產(chǎn)品,聚焦于軟件定義和硬件加速。
除此之外,Xilinx App Store也一并被發(fā)布,根據(jù)Ed Wright的介紹,該應用商店不僅能夠方便地消費選擇應用,還能方便地將方案推給客戶,預計賽靈思應用商店將成為客戶優(yōu)選的購買和部署加速應用的新方式。
在可組合概念逐漸深化之下,行業(yè)掀起一股新的浪潮,賽靈思的三款平臺產(chǎn)品也拉開了可組合性數(shù)據(jù)的序幕。通過賽靈思的部署來看,三款新平臺的核心除了可組合,還聚焦了開箱即用和即插即用這一概念。彼時,F(xiàn)PGA開發(fā)因其入門難度抵擋了許多開發(fā)者的腳步,賽靈思著重降低硬件開發(fā)的比重,從而讓開發(fā)應用成為“主戰(zhàn)場”。
記者認為,當FPGA普適于不同層級的開發(fā)者,開發(fā)重點愈發(fā)趨向應用本身,FPGA的低延時、高性能、靈活性和總擁有成本的優(yōu)勢將逐漸填補傳統(tǒng)計算領域空白,使得開發(fā)者有更廣的選擇空間。