云脈芯聯(lián)發(fā)布國(guó)內(nèi)首款多場(chǎng)景RDMA智能網(wǎng)卡(DPU)產(chǎn)品
5月31日,網(wǎng)絡(luò)互聯(lián)芯片提供商云脈芯聯(lián)正式發(fā)布自主研發(fā)的國(guó)內(nèi)首款多場(chǎng)景RDMA智能網(wǎng)卡(DPU)產(chǎn)品——xFusion50。
目前,隨著數(shù)字經(jīng)濟(jì)的飛速發(fā)展,數(shù)據(jù)中心已成為支撐和釋放CPU算力的重要基礎(chǔ)設(shè)施,承載著各類數(shù)字技術(shù)的應(yīng)用。高性能網(wǎng)絡(luò)作為數(shù)據(jù)中心的算力底座,在數(shù)據(jù)中心架構(gòu)演進(jìn)過(guò)程中扮演著重要角色,隨著摩爾定律放緩,多樣性異構(gòu)算力的崛起,如何通過(guò)降低網(wǎng)絡(luò)延遲提升數(shù)據(jù)中心集群算力性能指標(biāo),滿足Serverless云原生算力需求,面臨著諸多技術(shù)挑戰(zhàn),如:
TCP/IP網(wǎng)絡(luò)協(xié)議棧導(dǎo)致收發(fā)報(bào)文時(shí)延過(guò)大,無(wú)法滿足當(dāng)下HPC、AI計(jì)算和分布式存儲(chǔ)的高性能需求,同時(shí)TCP協(xié)議棧處理導(dǎo)致CPU負(fù)載高居不下;
隨著網(wǎng)絡(luò)帶寬的倍增和集群規(guī)模的擴(kuò)大,網(wǎng)絡(luò)擁塞問(wèn)題日益突出,確保網(wǎng)絡(luò)無(wú)損難度加大,網(wǎng)絡(luò)0.1%的丟包率將導(dǎo)致上層應(yīng)用算力性能只能發(fā)揮50%;
RDMA網(wǎng)絡(luò)技術(shù)已是大勢(shì)所趨,但在進(jìn)一步普及過(guò)程中缺乏兼容互通,靈活開(kāi)放的端到端方案,造成在數(shù)據(jù)中心大規(guī)模高效部署RDMA網(wǎng)絡(luò)有很高的技術(shù)門檻。
xFusion50是云脈芯聯(lián)成功自主研發(fā)的第一款產(chǎn)品,也是國(guó)內(nèi)首款實(shí)現(xiàn)包括支持端到端擁塞控制完整RDMA功能的DPU產(chǎn)品,xFusion50基于硬件實(shí)現(xiàn)的可編程擁塞控制算法能夠有效避免網(wǎng)絡(luò)擁塞,充分發(fā)揮RDMA技術(shù)的低延遲和高性能,支持云計(jì)算、高性能計(jì)算、AI、存儲(chǔ)集群全場(chǎng)景部署。
云脈芯聯(lián)創(chuàng)始人&總裁吳吉朋表示:“云脈芯聯(lián)自去年5月成立以來(lái),堅(jiān)持以‘專注用戶,引領(lǐng)創(chuàng)芯’為核心理念,在產(chǎn)品研發(fā)上以用戶需求為導(dǎo)向不斷砥礪創(chuàng)新。xFusion50的成功面市可有效幫助用戶降低部署RDMA網(wǎng)絡(luò)的技術(shù)門檻,實(shí)現(xiàn)高帶寬、低延遲的高性能集群組網(wǎng),全面提升算力集群整體效能。為不斷滿足用戶對(duì)多場(chǎng)景算力卸載和高性能網(wǎng)絡(luò)的需求,云脈芯聯(lián)下一代高性能DPU芯片的研發(fā)也在有序進(jìn)行中,不久即將面世,敬請(qǐng)期待?!?
xFusion50產(chǎn)品核心亮點(diǎn)
支持可編程擁塞控制算法
可編程擁塞控制算法是實(shí)現(xiàn)端到端無(wú)損網(wǎng)絡(luò)的關(guān)鍵技術(shù),xFusion50不僅能支持業(yè)界主流的擁塞控制算法,還可以通過(guò)開(kāi)放可編程的底層網(wǎng)絡(luò)接口,可根據(jù)客戶的組網(wǎng)特點(diǎn)和上層業(yè)務(wù)的需求,靈活支持多種擁塞控制算法,最大化業(yè)務(wù)的流量吞吐。
通過(guò)自主研發(fā)HyperDirect技術(shù)支持GPU Direct RDMA
為跨計(jì)算節(jié)點(diǎn)的GPU實(shí)現(xiàn)遠(yuǎn)程內(nèi)存直接訪問(wèn),跳過(guò)CPU以降低時(shí)延、提升帶寬,提升分布式異構(gòu)算力集群的整體效能。
支持網(wǎng)絡(luò)/存儲(chǔ)全場(chǎng)景卸載加速
支持vSwitch全卸載,實(shí)現(xiàn)云上VPC網(wǎng)絡(luò)全功能;支持存儲(chǔ)卸載,對(duì)接分布式存儲(chǔ)NVMe-oF(TCP/RDMA),充分釋放宿主機(jī)CPU資源。并通過(guò)支持VirtIO實(shí)現(xiàn)彈性網(wǎng)絡(luò)和彈性存儲(chǔ),滿足云上用戶無(wú)縫遷移和快速恢復(fù)的業(yè)務(wù)訴求。
xFusion50產(chǎn)品適用場(chǎng)景及解決方案
高性能集群場(chǎng)景
AI、HPC、分布式存儲(chǔ)等高性能集群場(chǎng)景中,對(duì)節(jié)點(diǎn)間的數(shù)據(jù)處理與通信有著低時(shí)延和高吞吐的訴求,xFusion50支持基于以太網(wǎng)的RDMA組網(wǎng)和可編程擁塞控制算法,實(shí)現(xiàn)高性能場(chǎng)景對(duì)低時(shí)延和高吞吐的需求,并配合云脈芯聯(lián)提供的xsc-easy-bench可大幅提升業(yè)務(wù)上線調(diào)試效率。
云計(jì)算場(chǎng)景
傳統(tǒng)云計(jì)算架構(gòu)基于CPU的軟件虛擬化技術(shù)提供IaaS業(yè)務(wù),大量CPU資源被用于處理與租戶業(yè)務(wù)無(wú)關(guān)的hypervisor層,租戶與云hypervisor共享CPU,租戶業(yè)務(wù)容易被管理業(yè)務(wù)影響,造成抖動(dòng)。xFusion50為云計(jì)算場(chǎng)景提供了一種基于裸金屬云的基礎(chǔ)設(shè)施架構(gòu),將hypervisor層卸載到xFusion50上,可滿足虛擬機(jī)、裸金屬、容器多種云上資源供給,并提供網(wǎng)絡(luò)/存儲(chǔ)加速功能,兼顧靈活性與高性能。