當前位置:首頁 > 廠商動態(tài) > 美光
[導(dǎo)讀]美光與AMD聯(lián)手為客戶及數(shù)據(jù)中心平臺提供一流的用戶體驗。雙方在奧斯汀建立聯(lián)合服務(wù)器實驗室,以減少服務(wù)器內(nèi)存驗證時間,在產(chǎn)品驗證和發(fā)布期間共同進行工作負載測試。目前美光適用于數(shù)據(jù)中心的 DDR5 內(nèi)存和第四代 AMD EPYCTMTM (霄龍)處理器均已出貨,我們對其進行了一些常見的高性能計算(HPC)工作負載基準測試。

美光與AMD聯(lián)手為客戶及數(shù)據(jù)中心平臺提供一流的用戶體驗。雙方在奧斯汀建立聯(lián)合服務(wù)器實驗室,以減少服務(wù)器內(nèi)存驗證時間,在產(chǎn)品驗證和發(fā)布期間共同進行工作負載測試。目前美光適用于數(shù)據(jù)中心的 DDR5 內(nèi)存和第四代 AMD EPYCTMTM(霄龍)處理器均已出貨,我們對其進行了一些常見的高性能計算(HPC)工作負載基準測試。

長期以來,超級計算機承擔(dān)著高性能計算工作負載。此類大規(guī)模的數(shù)據(jù)密集型工作負載需要運行TB 級的數(shù)據(jù)量以進行數(shù)百萬個并行操作,以解決人類世界的難題,如天氣和氣候預(yù)測;地震建模;化學(xué)、物理和生物分析等。隨著計算機架構(gòu)的進步,此類工作負載往往托管在超大型“可橫向擴展”的高性能服務(wù)器集群中。這些服務(wù)器集群需要集合最強大的算力、架構(gòu)、內(nèi)存和存儲基礎(chǔ)設(shè)施,以滿足關(guān)鍵工作負載對可擴展性、低延遲和高性能的需求。然而隨著服務(wù)器 CPU 的性能和吞吐量不斷增長,DDR4 無法提供足夠的內(nèi)存帶寬,來滿足不斷增長的高性能內(nèi)核。

為緩解這一瓶頸,美光 DDR5 內(nèi)存與采用了Zen 4 服務(wù)器架構(gòu)的第四代AMD EPYC 處理器強強聯(lián)合,使服務(wù)器 CPU 能夠更好地匹配內(nèi)存產(chǎn)品,滿足數(shù)據(jù)密集型工作負載對性能和效率的需求。美光DDR5 內(nèi)存可幫助企業(yè)從本地和云端數(shù)據(jù)中更快獲取洞察。我們對最新的 AMD Zen 4 96 核CPU和美光DDR5進行了行業(yè)內(nèi)高性能計算工作負載基準測試,所有結(jié)果均顯示性能提升了兩倍。

美光DDR5 搭配第四代 AMD EPYC 處理器,在STREAM 測試中實現(xiàn)內(nèi)存帶寬翻倍STREAM1是常見的基準測試工具,用于測量高性能計算機的內(nèi)存帶寬,可捕獲高性能計算系統(tǒng)的峰值內(nèi)存帶寬。該工作負載使用的軟件堆棧

Alma 9 Linux kernel 5.14

STREAM.f,2021 年 11 月 29 日發(fā)布版本

測試設(shè)置

DDR4 系統(tǒng)搭配第三代 64 核3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng)2的 RDIMM 內(nèi)存槽插滿,共 64GB

DDR5 系統(tǒng)搭配第四代96 核3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng)3的 RDIMM 內(nèi)存槽插滿,共 64GB

測試結(jié)果

DDR5 系統(tǒng)每插槽內(nèi)存帶寬翻倍,達到 378 GB/s

該結(jié)果意味著客戶能運行更大規(guī)模的人工智能/機器學(xué)習(xí)(AI/ML)項目,或利用 DDR5 增加的內(nèi)存帶寬進行更多高性能計算。

美光 DDR5,助力天氣研究和預(yù)報(WRF)4速度提升2倍此次測試使用的高性能計算工作負載代碼針對天氣和氣候。WRF模型在一些支持高性能浮點處理、高內(nèi)存帶寬、低延遲網(wǎng)絡(luò)等傳統(tǒng)高性能計算架構(gòu)中表現(xiàn)良好,測試對象為橫向分辨率為 2.5 公里的美國大陸地區(qū)(CONUS)。該工作負載使用的軟件堆棧

Alma 9 Linux kernel 5.14

WRF 2.3.5 & 4.3.3

Open MPI v4.1.1

測試設(shè)置

DDR4 系統(tǒng)搭配第三代64 核3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng)2的 RDIMM 內(nèi)存槽插滿,共 64GB

DDR5 系統(tǒng)搭配第四代 96 核3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng)3的 RDIMM 內(nèi)存槽插滿,共 64GB

測試結(jié)果

美光 DDR5 搭配第四代 AMD EPYC 處理器,可實現(xiàn) 1.3567 時間步/秒 VS DDR4 系統(tǒng)的2.8533 時間步/秒

速度更快意味著可使用更大的數(shù)據(jù)庫或運行更多模型以進行天氣預(yù)測,進而改善預(yù)測的準確度。

美光 DDR5,助力OpenFOAM5速度提升2倍OpenFOAM是一種計算流體動力學(xué)(CFD)的開源高性能計算工作負載,廣泛應(yīng)用于多個行業(yè),有助于縮短開發(fā)時間并降低成本。從消費類產(chǎn)品設(shè)計到航空航天設(shè)計,OpenFOAM能夠模擬不同應(yīng)用中的物理互動,包括摩托車風(fēng)擋湍流。在該模擬中,OpenFOAM能夠計算摩托車和騎手周圍的穩(wěn)定氣流。OpenFOAM能夠根據(jù)用戶指定的進程數(shù)進行負載均衡計算,以此將網(wǎng)格分解成多個部分并分配給不同的進程求解。求解完成后,再將網(wǎng)格和解重新組合為單個域。

該工作負載使用的軟件堆棧

OpenFOAM CFD 軟件(版本8),其中摩托車網(wǎng)格尺寸為:600 x 240 x 240

Alma 9 Linux kernel 5.14

Open MPI v4.1.1

測試設(shè)置

DDR4 系統(tǒng)搭配第三代64 核3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng)2的 RDIMM 內(nèi)存槽插滿,共 64GB

DDR5 系統(tǒng)搭配第四代 96 核3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng)3的 RDIMM 內(nèi)存槽插滿,共 64GB

測試結(jié)果

測試結(jié)果表明美光DDR5 產(chǎn)品組合將OpenFOAM性能提高了 2.4 倍。OpenFOAM為五大高性能計算軟件平臺之一,擁有大型開源社區(qū)。該軟件廣泛應(yīng)用于大學(xué)和研發(fā)中心,可利用高帶寬內(nèi)存和擁有密集內(nèi)核的高性能CPU,實現(xiàn)高度的并行操作。美光 DDR5 ,助力分子動力學(xué)6速度提升2倍CP2K 是一款開源量子化學(xué)工具,適用于許多應(yīng)用,包括固態(tài)生物系統(tǒng)模擬。CP2K 能夠為不同的建模方法提供通用的框架。此次測試對象為水(H2O)的密度泛函理論(DFT),模擬盒子中共包含 6,144 個原子(2,048 個水分子)。該工作負載使用的軟件堆棧

H2O-DFT-LS.NREP4 及 H2O-DFT-LS

Alma 9 Linux kernel 5.14

測試設(shè)置

DDR4 系統(tǒng)搭配第三代64 核3.7 GHz AMD EPYC 處理器;DDR4 3200 MHz 系統(tǒng)2的 RDIMM 內(nèi)存槽插滿,共 64GB

DDR5 系統(tǒng)搭配第四代 96 核3.7 GHz AMD EPYC 處理器;DDR5 4800 MHz 系統(tǒng)3的 RDIMM 內(nèi)存槽插滿,共 64GB

測試結(jié)果測試結(jié)果表明美光DDR5 產(chǎn)品組合將分子動力學(xué)性能提高了2.1 倍。隨著內(nèi)核數(shù)和內(nèi)存帶寬增加,此類工作負載的性能也顯著提升??偨Y(jié)目前我們只針對少量高性能計算工作負載進行了測試,因此以上只是我們的初步成果。將高性能高帶寬內(nèi)存與最新的服務(wù)器處理器(如第四代 AMD EPYC 處理器)相結(jié)合,可為高性能計算客戶創(chuàng)造新的可能。我們期待更多企業(yè)數(shù)據(jù)中心和云服務(wù)商,能夠在新平臺上應(yīng)用美光 DDR5 產(chǎn)品,解鎖更高的性能與能效。

________________________

1 我們在 STREAM 基準測試中配置了 25 億個向量的STREAM Benchmark——運行在一臺單 AMD CPU 系統(tǒng)上2 AMD DDR4 系統(tǒng)為一臺 64 核 AMD EPYC 7763處理器, DDR4-3200 MHz 的RDIMM 內(nèi)存槽插滿,共 64GB3 AMD DDR5 系統(tǒng)為一臺96 核AMD EPYC 9654處理器, DDR5-4800 MHz 的RDIMM 內(nèi)存槽插滿,共 64GB4 橫向分辨率為12.5 公里CONUS 的 WRF 在 DDR4 系統(tǒng)上的運行時間為 929 秒,在 DDR5 系統(tǒng)上的運行時間為 287 秒(均包括存儲器的輸入/輸出時間)。該測試中 WRF 配置為 2.5 公里 CONUS,測試結(jié)果為1.3567 時間步/ 秒,相比之下DDR4 的運行時間為2.8533時間步/秒。5 針對OpenFOAM,我們運行了三種變體:5a:1004040 runtimes,DDR4 系統(tǒng)運行時間為 1,144 秒,DDR5 系統(tǒng)運行時間為 478 秒5b:1084646 runtimes,DDR4 系統(tǒng)運行時間為 1,633 秒,DDR5 系統(tǒng)運行時間為 698 秒5c:1305252 runtimes,DDR4 系統(tǒng)運行時間為 2,522秒,DDR5 系統(tǒng)運行時間為 1,091 秒6分子動力學(xué)工作負載在 DDR4 系統(tǒng)上的運行時間為 2,519 秒,在 DDR5 系統(tǒng)上的運行時間為 1,242 秒

作者:

Krishna Yalamanchi

Krishna 擔(dān)任美光生態(tài)系統(tǒng)高級開發(fā)經(jīng)理,專注于研發(fā) DDR5 和 CXL 解決方案。他曾在英特爾 IT 部門任職,領(lǐng)導(dǎo) SAP HANA 的遷移工作,通過與SI、OEM和云服務(wù)提供商共同搭建的合作伙伴生態(tài)系統(tǒng),推出了用于SAP工作負載的第三代與第四代 Intel Xeon 處理器。

SudharshanVazhkudai

Sudharshan S. Vazhkudai博士擔(dān)任美光系統(tǒng)架構(gòu)和工作負載分析總監(jiān)。他領(lǐng)導(dǎo)一支位于奧斯汀和印度海得拉巴的團隊,致力于研究內(nèi)存和存儲(DDR、CXL、HBM 和 NVME)產(chǎn)品中層次結(jié)構(gòu)的可組合性,并優(yōu)化與數(shù)據(jù)中心工作負載相關(guān)的系統(tǒng)架構(gòu)。


本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉