借助全新 AMD Alveo? V80 計算加速卡釋放計算能力
對于大規(guī)模數(shù)據(jù)處理,最佳性能不僅取決于原始計算能力,還取決于高存儲器帶寬。 因此,全新 AMD Alveo? V80 計算加速卡專為具有大型數(shù)據(jù)集的內(nèi)存受限型應(yīng)用而設(shè)計,這些應(yīng)用需要 FPGA 硬件靈活應(yīng)變能力以實現(xiàn)工作負(fù)載優(yōu)化。Alveo V80 加速卡現(xiàn)已量產(chǎn)出貨,其能提供較之上一代加速卡至高 2 倍的帶寬與計算密度1,并為使用 AMD Vivado? 設(shè)計套件的 FPGA 設(shè)計人員提供簡化的開發(fā)流程。
圖1:Alveo V80 計算加速卡
這款全新加速卡采用全高、3/4 長( FH?L )尺寸規(guī)格,由 AMD Versal? HBM 自適應(yīng) SoC 提供支持,具備 2,600,000 個 LUT 邏輯單元的 FPGA 架構(gòu)、10,848 個 DSP 計算邏輯片以及 820 GB/s 的存儲器帶寬,從而助力克服性能瓶頸。
與前代產(chǎn)品 AMD Alveo U55C 計算加速卡相比,Alveo V80 的邏輯密度至高翻倍、存儲器帶寬至高翻倍且網(wǎng)絡(luò)帶寬可高至 4 倍1,可以實現(xiàn)強大的計算集群,同時還能優(yōu)化卡、服務(wù)器數(shù)量以及機架空間。
面向大型數(shù)據(jù)集和內(nèi)存密集型工作負(fù)載專屬打造的網(wǎng)絡(luò)附接加速卡
Alveo V80 卡的硬件靈活性允許跨不同的自定義工作負(fù)載進(jìn)行廣泛應(yīng)用。作為一款 4x200G 網(wǎng)絡(luò)附接加速卡,該卡可以實時處理大量傳入數(shù)據(jù),避開 GPU 遇到的 PCIe® 連接限制。
圖 2:大規(guī)模加速計算密集型內(nèi)存受限工作負(fù)載
Alveo V80 加速卡可通過以太網(wǎng)擴展到數(shù)百個節(jié)點實現(xiàn)計算集群,非常適合一系列高性能計算應(yīng)用,包括基因組測序、分子動力學(xué)和傳感器處理。 在網(wǎng)絡(luò)安全方面,內(nèi)置 400G 加密引擎和 600G 以太網(wǎng)硬塊,加之 FPGA 的硬件靈活性,令 Alveo V80 加速器適用于線速數(shù)據(jù)包檢測和 AI 支持的異常檢測。
該加速卡還非常適合計算存儲和數(shù)據(jù)分析,能夠在同一張卡上集成壓縮和查詢加速,從而增加有效存儲容量,同時更快獲得洞察。此外,它還適合于各種金融科技應(yīng)用,包括策略回測、期權(quán)定價以及金融建模與仿真。
案例:天體物理學(xué)計算飛躍
聯(lián)邦科學(xué)與工業(yè)研究組織( CSIRO )是澳大利亞的國立研究組織,其參與建造了世界上最大的射電天文學(xué)天線陣列,該天線陣列目前包含 420 張 Alveo U55C 加速器卡用于處理無線電波,以研究早期宇宙并探索星系演化。
CSIRO計劃借助 Alveo V80 加速卡縮減占板面積與成本,并將所需加速卡的數(shù)量精簡多達(dá) 66%,同時應(yīng)對來自望遠(yuǎn)鏡 131,000 個天線的新信號處理任務(wù)。考慮到卡、服務(wù)器、機架空間和功耗的潛在減少,每卡算力的躍升預(yù)計可帶來至高 20% 總擁有成本( TCO )下降2。
CSIRO 空間與天文學(xué)部研究工程師 Grant Hampson 表示:“我們起初采用 Alveo 產(chǎn)品線是因為它能夠?qū)崟r處理大量傳感器數(shù)據(jù)。對于我們的下一代波束成形器和相關(guān)器來說,降低總擁有成本勢在必行。 Alveo V80 加速卡是對上一代 Alveo U55C 卡的技術(shù)階躍提升,以經(jīng)濟(jì)高效的占板面積提供了緊湊、節(jié)能的解決方案2?!?
圖 3:AMD Alveo V80 加速卡實現(xiàn)的預(yù)估傳感器處理和 TCO 節(jié)省2(參見尾注 ALV-162)
為 FPGA 設(shè)計人員簡化開發(fā)
Alveo V80 加速卡經(jīng)由 Alveo Versal 示例設(shè)計( AVED )完全可為傳統(tǒng)硬件開發(fā)人員使用,現(xiàn)已在 GitHub 上提供。AVED 利用傳統(tǒng) FPGA 和 RTL 流程簡化了硬件啟動,并且基于常見的 Vivado 工具流程。示例設(shè)計采用在 AMD Versal 自適應(yīng) SoC 上實現(xiàn)并專門針對 Alveo V80 加速器卡的預(yù)構(gòu)建子系統(tǒng),提供了高效的起點。
在系統(tǒng)層面,Alveo V80 計算加速卡簡化了系統(tǒng)集成并提供了快速的量產(chǎn)路徑。通過使用預(yù)先驗證的部署卡,設(shè)計團(tuán)隊可以避開 PCB 集成、庫存管理和產(chǎn)品生命周期管理任務(wù)。
現(xiàn)已出貨
Alveo V80 已投入量產(chǎn),現(xiàn)可從 AMD 和授權(quán)經(jīng)銷商處購買。
1:基于截至 2024 年 4 月公開發(fā)布的 AMD Alveo 產(chǎn)品選型指南中發(fā)布的規(guī)格。(ALV-13)。
2:基于 CSIRO 在 2023 年 10 月進(jìn)行的獨立“早期試用體驗”性能和成本分析估算,比較了 420 張 Alveo U55C 加速卡的現(xiàn)有實施與 140 張 AMD Alveo V80 加速卡的預(yù)期實施。預(yù)計總擁有成本以三年期計算,包括電力和冷卻運營支出的預(yù)計成本。所有性能和成本節(jié)省聲明均為 CSIRO 提供的估算值,未經(jīng) AMD 驗證。性能和成本效益受各種假設(shè)和變量影響,且可能基于系統(tǒng)配置和其他因素而發(fā)生變化。 結(jié)果僅針對 CSIRO,可能不具典型性。有關(guān)更多詳細(xì)信息,請參見圖 (3) (ALV-16)。