當(dāng)前位置:首頁 > 廠商動態(tài) > 廠商文章
[導(dǎo)讀]在2020年全球數(shù)字超算大會(SC20大會)上,NVIDIA宣布推出NVIDIA? Mellanox? 400G InfiniBand產(chǎn)品。

在2020年全球數(shù)字超算大會(SC20大會)上,NVIDIA宣布推出NVIDIA® Mellanox® 400G InfiniBand產(chǎn)品,這是全球第一代400Gb/s網(wǎng)速的端到端網(wǎng)絡(luò)解決方案,可為全球的AI和HPC用戶提供最快的網(wǎng)絡(luò)互連性能,同時將計算、可編程性和軟件定義三種技術(shù)成功地融于一體,成為業(yè)界領(lǐng)先的軟件定義、硬件加速的可編程網(wǎng)絡(luò),為全球的科研人員和工程人員設(shè)計新一代計算系統(tǒng)和提升應(yīng)用性能提供了新的思路。

NVIDIA Mellanox InfiniBand NDR產(chǎn)品是第7代的InfiniBand產(chǎn)品,利用100Gb/s的PAM4 Serdes技術(shù), 實現(xiàn)了400Gb/s的單端口傳輸帶寬, 是上一代產(chǎn)品的兩倍, 同時通過添加更多、更強(qiáng)大的加速引擎,實現(xiàn)了更強(qiáng)大的計算和通信能力。

E級AI和HPC時代來臨,InfiniBand NDR網(wǎng)絡(luò)實現(xiàn)更強(qiáng)計算和通信能力

“Speed Of Light”是關(guān)于NDR InfiniBand技術(shù)的第一個特征,通過加倍的帶寬、更快的包處理能力(Message Rate), 讓基于RDMA、GPU Direct RDMA和GPU Direct Storage等先進(jìn)通信技術(shù)的應(yīng)用性能得到了進(jìn)一步提升。InfiniBand網(wǎng)絡(luò)是天然的SDN網(wǎng)絡(luò),可以讓用戶根據(jù)應(yīng)用的屬性來選擇各種不同的網(wǎng)絡(luò)拓?fù)?,以達(dá)到最優(yōu)的性能,如Fat-Tree、DragonFly+、各種Torus等。如通過DragonFly+網(wǎng)絡(luò)拓?fù)淇梢栽?個交換機(jī)Hop內(nèi)達(dá)到一百萬個節(jié)點的同時通信,這個規(guī)模遠(yuǎn)遠(yuǎn)超出了E級機(jī)、甚至10E級機(jī)或百E級機(jī)需要的規(guī)模;同時其天然的SDN屬性也讓動態(tài)路由和網(wǎng)絡(luò)擁塞控制變得更容易實現(xiàn)。InfiniBand動態(tài)路由已經(jīng)被廣泛地應(yīng)用到各種網(wǎng)絡(luò)拓?fù)洚?dāng)中,成為優(yōu)化通信性能的關(guān)鍵手段,如美國橡樹林國家實驗室的Summit超級計算機(jī)就通過動態(tài)路由將超算中心全網(wǎng)的通信效率從60%提升到了96%。NDR InfiniBand交換機(jī)在1U空間內(nèi)可以支持64個400Gb/s的端口或128個200Gb/s的端口,是上一代交換機(jī)端口密度的3倍;它還將框式交換機(jī)系統(tǒng)的聚合雙向吞吐量提高了5倍,達(dá)到1.64 petabits/s,是全球端口數(shù)最多、交換容量最大的交換機(jī)。

硬件加速是InfiniBand網(wǎng)絡(luò)的最大特色,隨著越來越多的加速引擎被添加到InfiniBand硬件中來,進(jìn)一步加大了其相對于其它網(wǎng)絡(luò)技術(shù)的領(lǐng)先性。如NDR InfiniBand實現(xiàn)了對于業(yè)界最頭疼的All2All和Allreduce通信的硬件卸載,能讓MPI通信的性能提升四倍。NDR InfiniBand對于MPI Tag Matching的硬件卸載,實現(xiàn)了1. 8倍的MPI通信性能提升。NDR InfiniBand可以實現(xiàn)對于NVMeoF的全面卸載, NVMeoF的Target卸載可以讓存儲系統(tǒng)在幾乎不消耗Target端CPU的前提下達(dá)到數(shù)以百萬級的IOPS,NVME SNAP可以實現(xiàn)對于NVMeoF的Initiator端的卸載,同時可以將InfiniBand網(wǎng)絡(luò)模擬成NVMe磁盤提供給主機(jī)CPU,可以解決目前很多OS還沒有NVMeoF的Initiator支持的問題,實現(xiàn)了對任何OS, 無論是虛擬化還是物理機(jī)的全面NVMeoF的支持;InfiniBand FIO SNAP可以實現(xiàn)對于文件存儲的本地模擬,讓任何OS都可以享受最先進(jìn)的分布式文件存儲系統(tǒng)的性能優(yōu)勢。

InfiniBand SHARP (Scalable Hierarchical Aggregation and Reduction Protocol) 技術(shù)徹底消除了MPI或者NCCL的Allreduce操作中的多打一通信帶來的Incast Burst問題,在保證所有端口全線速、共計12.8Tb/s或25.6Tb/s的數(shù)據(jù)輸入的前提下,實現(xiàn)在交換機(jī)上的Allreduce、Barrier、Reduce和Broadcast計算,在NDR交換機(jī)上更是實現(xiàn)了相比上一代交換機(jī)32倍的計算性能提升。InfiniBand SHIELD (Self-Healing) 技術(shù)實現(xiàn)了網(wǎng)絡(luò)中鏈路故障的自修復(fù),讓網(wǎng)絡(luò)無需等待管理軟件的參與來恢復(fù)鏈路故障,實現(xiàn)了比傳統(tǒng)的軟件故障恢復(fù)快千倍以上的性能,讓應(yīng)用不再受困鏈路故障的干擾,提升應(yīng)用的性能。

InfiniBand安全卸載是面向Cloud Native的應(yīng)用場景,InfiniBand已經(jīng)得到了Open Stack的官方軟件支持,通過自帶的硬件IPSec、TLS、AES、Root of Trust等功能,可以讓數(shù)據(jù)不論是在網(wǎng)絡(luò)中流動時,還是在向存儲中落盤時都能以線速性能得到加解密,實現(xiàn)了在虛擬化環(huán)境或者在容器化環(huán)境中的安全保障。

軟件可編程讓InfiniBand的應(yīng)用場景得到了進(jìn)一步的延伸,可編程的NDR InfiniBand不僅可以讓用戶處理數(shù)據(jù)的header,還可以對于數(shù)據(jù)的數(shù)據(jù)路徑進(jìn)行操作,如用戶可以自定義規(guī)則對于數(shù)據(jù)路徑進(jìn)行操作;或是對于數(shù)據(jù)直接在網(wǎng)絡(luò)中進(jìn)行預(yù)處理而無需送到CPU做預(yù)處理。用戶還可以對于數(shù)據(jù)的通信特征進(jìn)行提取、然后利用AI技術(shù)對其進(jìn)行訓(xùn)練,得到不同應(yīng)用數(shù)據(jù)的通用通信特征,如果發(fā)現(xiàn)有異常通信信息,可以向管理員主動發(fā)出預(yù)警。

E級AI和HPC時代來臨,InfiniBand NDR網(wǎng)絡(luò)實現(xiàn)更強(qiáng)計算和通信能力

NVIDIA Mellanox NDR 400G InfiniBand亮點

NDR InfiniBand以其優(yōu)異的性能和靈活廣泛的使用場景吸引了眾多的合作伙伴一起共建生態(tài)系統(tǒng),包括Atos、戴爾科技、富士通、浪潮、聯(lián)想和SuperMicro等服務(wù)器廠商,以及DDN、IBM Storage等存儲廠商。各家公司都已開始研發(fā)其新一代產(chǎn)品,實現(xiàn)對于NDR InfiniBand的支持。而包括微軟Azure公有云、美國Los Alamos國家實驗室、歐洲Jülich超算中心等全球各頂級用戶都紛紛表示,期待能盡快應(yīng)用NDR InfiniBand到他們的業(yè)務(wù)中去,享受NDR的技術(shù)優(yōu)勢。

NVIDIA網(wǎng)絡(luò)高級副總裁Gilad Shainer表示: “我們AI客戶最重要的工作就是處理日益復(fù)雜的應(yīng)用程序,這需要更快速、更智能、更具擴(kuò)展性的網(wǎng)絡(luò)。NVIDIA Mellanox 400G InfiniBand的海量吞吐量和智能加速引擎,幫助HPC、AI和超大規(guī)模云基礎(chǔ)設(shè)施以更低的成本和復(fù)雜性,實現(xiàn)無與倫比的性能?!?

E級AI和HPC時代已經(jīng)來臨,同時帶來新的挑戰(zhàn),軟件定義、硬件加速、面向網(wǎng)絡(luò)計算的可編程N(yùn)DR InfiniBand產(chǎn)品將于2021年第二季度提供樣品。NDR產(chǎn)品的出現(xiàn),將會大幅提升E級AI和HPC系統(tǒng)的性能和效率,簡化系統(tǒng)的管理和操作,降低系統(tǒng)的TCO,進(jìn)而保護(hù)數(shù)據(jù)中心的投資。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉