大緩存更強(qiáng)勁,搭載AMD Milan-X的浪潮GPU服務(wù)器NF5468A5的深度評(píng)測(cè)首次發(fā)布
北京2022年6月14日 /美通社/ -- 近日,專業(yè)媒體"架構(gòu)師技術(shù)聯(lián)盟"發(fā)布了基于浪潮GPU服務(wù)器NF5468A5的性能測(cè)評(píng)報(bào)告。報(bào)告顯示,NF5468A5搭載2顆AMD Milan-X 7773X運(yùn)行常見(jiàn)的氣象應(yīng)用WRF和計(jì)算流體力學(xué)應(yīng)用OpenFOAM作為性能基準(zhǔn)測(cè)試,其性能相比搭載兩顆Rome 7742時(shí)的計(jì)算性能提升可高達(dá)80%。
NF5468A5是一款4U支持2顆AMD EPYC處理器和8顆雙寬GPU卡,面向AI訓(xùn)練、推理、視頻編解碼等多種應(yīng)用場(chǎng)景的GPU服務(wù)器。此次測(cè)試采用分別搭載2顆AMD Milan-X 7773X、Milan 7543和Rome 7742的配置組合。
AMD Milan-X處理器最大的亮點(diǎn),就是采用3D堆疊技術(shù)(3D V-Cache),在不改變處理器面積的前提下,可用L3 緩存(SRAM)總數(shù)增加三倍。做個(gè)形象的比喻,這種3D堆疊技術(shù)就像將把相同面積的平房升級(jí)成三層小樓,通過(guò)縱向空間成倍擴(kuò)展緩存數(shù)量。評(píng)測(cè)采用的NF5468A5平臺(tái)是浪潮信息暢銷海內(nèi)外的彈性云AI服務(wù)器NF5468系列的全新產(chǎn)品,率先支持PCIe 4.0技術(shù),4U空間內(nèi)可裝載2顆采用7nm先進(jìn)制程工藝的AMD EPYC處理器和8塊PCIe Gen4接口的AI加速卡,能夠最大限度的發(fā)揮Milan-X處理器的極致性能。
WRF(The Weather Research and Forecasting Model),即天氣預(yù)報(bào)模式,被譽(yù)為是次世代的中尺度天氣預(yù)報(bào)模式,往往用于大范圍高分辨的氣候模擬,對(duì)系統(tǒng)的運(yùn)算性能、內(nèi)存的要求非常高;OpenFOAM(Open Source Field Operation and Manipulation)是對(duì)連續(xù)介質(zhì)力學(xué)問(wèn)題進(jìn)行數(shù)值計(jì)算的軟件,經(jīng)常應(yīng)用于汽車仿真等行業(yè),進(jìn)行仿真計(jì)算需要處理大量的實(shí)時(shí)數(shù)據(jù),所以對(duì)系統(tǒng)的計(jì)算能力、數(shù)據(jù)吞吐能力都有很高的要求。
基于浪潮NF5468A5評(píng)測(cè)報(bào)告顯示,Milan-X處理器通過(guò)搭載3D堆疊技術(shù)獲得更高的L3緩存,確實(shí)對(duì)計(jì)算性能有較大提升,而性能改進(jìn)意味著企業(yè)可以在更少的服務(wù)器上運(yùn)行相同的作業(yè),消耗的功率也能有明顯降低。如下是評(píng)測(cè)報(bào)告中的性能測(cè)試數(shù)據(jù):
在WRF測(cè)試中,使用單節(jié)點(diǎn)相同核心數(shù),以Rome 7742處理器運(yùn)行時(shí)間為基準(zhǔn),在Milan 7543上的計(jì)算性能提升14%~27%,而在Milan-X 7773X處理器上性能提升 23%~34%。
在OpenFOAM基準(zhǔn)算例motorBike測(cè)試中,使用不可壓穩(wěn)態(tài)求解器simpleFoam計(jì)算模擬摩托車和騎手周圍空氣的運(yùn)動(dòng)情況。同樣以Rome 7742處理器為基準(zhǔn),OpenFOAM在Milan 7543處理器使用單節(jié)點(diǎn)相同核心測(cè)試性能提升23%~28%,在Milan-X 7773X處理器上性能提升34%~80%。
在本次評(píng)測(cè)中也對(duì)NF5468A5有比較細(xì)致的介紹,據(jù)浪潮官網(wǎng)顯示NF5468A5正在推出"超值機(jī)型 限免試用",對(duì)該GPU服務(wù)器感興趣的不妨一試。如下是評(píng)測(cè)中對(duì)于浪潮NF5468A5的介紹:
NF5468A5采用分區(qū)散熱設(shè)計(jì),內(nèi)置獨(dú)立的CPU和GPU主板,且分別安裝在不同的平面。從機(jī)箱內(nèi)部結(jié)構(gòu)來(lái)看,設(shè)計(jì)者將發(fā)熱量高的的GPU放在了機(jī)箱上3U空間,CPU板處于機(jī)箱下1U,內(nèi)置6對(duì)12個(gè)6056風(fēng)扇模組配合導(dǎo)風(fēng)罩,實(shí)現(xiàn)機(jī)箱內(nèi)風(fēng)道分流,正是基于這種獨(dú)特分層散熱設(shè)計(jì),使得送測(cè)的NF5468A5服務(wù)器可以支持280W最高功耗的Milan-X 7773X。系統(tǒng)設(shè)計(jì)支持32條DDR4 ECC內(nèi)存,支持LRDIMM/RDIMM,提供高達(dá)8T的本地內(nèi)存,實(shí)現(xiàn)與1536 MB 超大L3 cache間的高速數(shù)據(jù)交互。
NF5468A5采用了CPU直連GPU架構(gòu)設(shè)計(jì),率先支持PCI-E 4.0技術(shù),最大限度提升CPU與GPU間的帶寬,降低通信延遲,達(dá)到最佳效能,為客戶提供極致優(yōu)化的算力。系統(tǒng)提供豐富的IO擴(kuò)展能力,提供10個(gè)PCIe 4.0 X16擴(kuò)展槽位,支持8個(gè)全高全長(zhǎng)的GPU加速卡。提供靈活存儲(chǔ)方案,可選前置12 × 3.5英寸硬盤或24 × 2.5英寸硬盤,提供超大的本地存儲(chǔ)能力,同時(shí)最大可支持8個(gè)熱插拔NVMe SSD全閃配置,提供存儲(chǔ)到內(nèi)存到L3 cache的高速訪存,可實(shí)現(xiàn)十倍于高端企業(yè)級(jí)SATA SSD的IOPS性能,帶來(lái)極致IO存儲(chǔ)性能飛躍。