AMD在SC19上帶來(lái)從超級(jí)計(jì)算機(jī)到云端HPC的超強(qiáng)性能
掃描二維碼
隨時(shí)隨地手機(jī)看文章
2019年11月19日,丹佛訊——在2019國(guó)際超算大會(huì)(SC19)上,AMD公司不斷擴(kuò)大其在高性能計(jì)算(HPC)領(lǐng)域的領(lǐng)先地位,并宣布其在全球頂級(jí)研究系統(tǒng)中贏得了一系列新客戶。AMD還宣布了支持AMD EPYC處理器和Radeon Instinct加速器的新平臺(tái),并發(fā)布ROCm 3.0版本,為新的編譯器和HPC應(yīng)用提供強(qiáng)勁支持。
AMD執(zhí)行副總裁、首席技術(shù)官M(fèi)ark Papermaster表示:“AMD很榮幸作為Frontier的處理器供應(yīng)商參加SC19。眾所周知,F(xiàn)rontier預(yù)期將在2021年交付時(shí)成為世界上性能最強(qiáng)的超級(jí)計(jì)算機(jī)。本周在SC19上,與會(huì)者可以體驗(yàn)到與用于這一E級(jí)超算系統(tǒng)相同的AMD技術(shù)。無(wú)論是在高速互連中協(xié)同工作的高性能AMD EPYC CPU和Radeon Instinct GPU,還是AMD開(kāi)放的軟件生態(tài)系統(tǒng),都將由超級(jí)計(jì)算領(lǐng)域的巨擘們帶來(lái)在SC19上亮相。”
在SC19,Mark Papermaster將與來(lái)自Cray、CERN和賽靈思的首席技術(shù)官們共同參加討論,探討在E級(jí)超算系統(tǒng)以及更多包括跨硬件、軟件和編程工具等新技術(shù)方面的創(chuàng)新突破。
新的Amazon EC2計(jì)算優(yōu)化實(shí)例將使用第二代AMD EPYC
亞馬遜云服務(wù)(AWS)擴(kuò)大了對(duì)AMD EPYC處理器的采用,并宣布即將推出兩款新的Amazon Elastic Compute Cloud(Amazon EC2)計(jì)算優(yōu)化的實(shí)例C5a和C5ad。并且,這些實(shí)例將由運(yùn)行頻率高達(dá)3.3Ghz的定制版第二代AMD EPYC處理器驅(qū)動(dòng)。C5a和C5ad將提供8種虛擬化大小和最多96個(gè)vCPU,幫助客戶針對(duì)各種計(jì)算密集型工作負(fù)載(包括批處理,分布式分析和Web應(yīng)用程序)在成本和性能上提供更多選擇。除此之外,為了讓客戶的應(yīng)用程序能夠直接訪問(wèn)基礎(chǔ)服務(wù)器的處理器和內(nèi)存資源,兩種實(shí)例都將提供裸機(jī)版本。這些實(shí)例將在96個(gè)物理核心上擁有192個(gè)邏輯處理器,是目前EC2計(jì)算優(yōu)化實(shí)例家族中最大實(shí)例的兩倍。C5a和C5ad裸機(jī)實(shí)例能夠利用100 Gbps網(wǎng)絡(luò)帶寬,并與Elastic Fabric Adapter兼容,從而使客戶能夠擴(kuò)展高性能計(jì)算和其他大型計(jì)算密集型的工作負(fù)載。新實(shí)例將在近期在多個(gè)AWS區(qū)域提供。
AMD將超級(jí)計(jì)算機(jī)推向新高度,EPYC進(jìn)入TOP500強(qiáng)榜單
HPC組織們正在持續(xù)采用第二代AMD EPYC處理器和Radeon Instinct加速器來(lái)構(gòu)建更多功能更強(qiáng)、效率更高的超級(jí)計(jì)算系統(tǒng)。Radeon Instinct GPU加速器可為HPC工作負(fù)載提供高達(dá)6.6 TFLOPS 的理論峰值雙精度運(yùn)算性能。而且,第二代AMD EPYC處理器和Radeon Instinct加速器均支持PCIe 4.0,可實(shí)現(xiàn)高帶寬互連,從而在異構(gòu)系統(tǒng)中實(shí)現(xiàn)更快的計(jì)算。
部署AMD處理器和加速器的最新客戶包括:
·數(shù)字轉(zhuǎn)換的全球領(lǐng)導(dǎo)者Atos正在向法國(guó)氣象局提供兩臺(tái)基于第二代EPYC的BullSequana XH2000超級(jí)計(jì)算機(jī),用于大氣、海洋和氣候科學(xué)的動(dòng)態(tài)天氣預(yù)報(bào)和研究。
·Atos和法國(guó)國(guó)家高性能計(jì)算組織GENCI宣布其Joliot-Curie超級(jí)計(jì)算機(jī)的最新擴(kuò)展現(xiàn)在可供運(yùn)作。該超級(jí)計(jì)算機(jī)基于Atos的BullSequana XH2000 解決方案和第二代EPYC處理器,并由CEA團(tuán)隊(duì)在其TGCC(超大型計(jì)算中心)進(jìn)行管理。
·Joliot-Curie超級(jí)計(jì)算機(jī)的擴(kuò)展進(jìn)入TOP500強(qiáng)第54位,成為全球排行榜中第一臺(tái)配備280W AMD EPYC 7H12 64核處理器的超級(jí)計(jì)算機(jī)。
·HPE所屬公司Cray近期宣布,推出兩臺(tái)配備第二代AMD EPYC處理器且基于Shasta?超級(jí)計(jì)算機(jī)架構(gòu)的新型超級(jí)計(jì)算機(jī)ARCHER2和Vulcan。
·戴爾科技集團(tuán)正在為圣地亞哥超級(jí)計(jì)算機(jī)中心及其Expanse超級(jí)計(jì)算機(jī)提供基于第二代AMD EPYC的Dell EMC PowerEdge服務(wù)器。
·蘇黎世聯(lián)邦理工學(xué)院在其Euler VI系統(tǒng)中使用了AMD EPYC 7742處理器。
·日本電氣有限股份公司(NEC)目前正在提供德國(guó)天氣預(yù)報(bào)服務(wù),其使用的Deutscher Wetterdienst系統(tǒng)結(jié)合了第二代EPYC處理器和NEC SX-Aurora TSUBASA矢量引擎。
蘇黎世聯(lián)邦理工學(xué)院負(fù)責(zé)科學(xué)IT服務(wù)的Christian Bolliger表示: “我們之所以選擇AMD EPYC 7742處理器,是因?yàn)樵撎幚砥鞑粌H能為研究人員日常使用的大多數(shù)軟件應(yīng)用提供廣泛支持,并且還能提供令人印象深刻的原始性能、內(nèi)存和I/O帶寬。更重要的是,它滿足了研究人員所需的性價(jià)比。憑借基于第二代AMD EPYC處理器的Euler VI系統(tǒng),研究人員可以獲得推進(jìn)研究所需的諸多功能。”
AMD EPYC將超級(jí)計(jì)算帶入云時(shí)代
HPC領(lǐng)域正在不斷演進(jìn),以滿足新的工作負(fù)載和更高的性能要求。最重要的是,HPC需要更易于被長(zhǎng)期或臨時(shí)使用。如今,這一切正在通過(guò)云來(lái)實(shí)現(xiàn)。與內(nèi)部部署相比,云端部署能以較低的使用成本為用戶帶來(lái)同等水平的卓越性能。
早前,Microsoft Azure宣布使用在基于第一代AMD EPYC處理器的系統(tǒng)上運(yùn)行的Azure HB云實(shí)例,獲得了此前無(wú)法企及的計(jì)算流體力學(xué)(CFD)性能水平。
如今,Azure針對(duì)高性能計(jì)算的Azure HBv2虛擬機(jī)已經(jīng)提供預(yù)覽,進(jìn)一步突破了云端高性能計(jì)算的邊界。這些虛擬機(jī)全部基于AMD EPYC 7742處理器,為客戶帶來(lái)了超級(jí)計(jì)算機(jī)性能,支持200Gbps HDR InfiniBand和單項(xiàng)工作多達(dá)80,000個(gè)核心,通過(guò)云就可以輕松、便捷地訪問(wèn)。
AMD推出ROCm 3.0版本
對(duì)“準(zhǔn)E級(jí)超算”(pre-exascale)軟件生態(tài)系統(tǒng)的社區(qū)支持繼續(xù)擴(kuò)大,該生態(tài)系統(tǒng)建立在由AMD提供的GPU計(jì)算基礎(chǔ)開(kāi)源組件ROCm之上。ROCm以月為周期發(fā)布新功能,為開(kāi)發(fā)人員提供固定的節(jié)奏來(lái)持續(xù)更新和改進(jìn)編譯器、庫(kù)、分析器、調(diào)試器和系統(tǒng)管理等工具。在SC19上,AMD針對(duì)這一領(lǐng)域的主要宣布包括:
·發(fā)布支持HIP-clang的ROCm 3.0版本。HIP-clang是基于LLVM的編譯器,利用hipify-clang改進(jìn)了CUDA轉(zhuǎn)換性能,并針對(duì)HPC和ML都進(jìn)行了庫(kù)優(yōu)化。
·ROCm上游集成到了領(lǐng)先的TensorFlow和PyTorch機(jī)器學(xué)習(xí)框架中,用于強(qiáng)化學(xué)習(xí)、自動(dòng)駕駛以及圖像和視頻檢測(cè)等應(yīng)用。
·擴(kuò)展了對(duì)HPC編程模型和應(yīng)用程序的加速支持, 例如OpenMP編程、LAMMPS和NAMD。
·對(duì)系統(tǒng)和工作負(fù)載部署工具(如Kubernetes、Singularity、SLURM、TAU等)提供新的支持。
不斷擴(kuò)張的硬件生態(tài)系統(tǒng)
由于HPC系統(tǒng)必須滿足愈發(fā)苛刻的工作負(fù)載,因此,由CPU和加速器驅(qū)動(dòng)的異構(gòu)計(jì)算對(duì)于現(xiàn)代HPC系統(tǒng)至關(guān)重要。AMD的合作伙伴正在建立能夠滿足異構(gòu)計(jì)算需求的新平臺(tái),以及傳統(tǒng)的僅用于計(jì)算的CPU:
·技嘉科技宣布推出四款新的支持第二代AMD EPYC處理器的G系列GPU服務(wù)器,即G292-Z22、G292-Z42、G482-Z50和G482-Z51。G482-Z51最多可支持8個(gè)PCIe 4.0 GPU卡,為客戶提供了出色的“AMD + AMD”選擇,可用于多種加速計(jì)算的工作負(fù)載。
·繼破紀(jì)錄的HPE ProLiant DL325 Gen10和DL385 Gen10服務(wù)器之后,新的Gen10 Plus型號(hào)現(xiàn)在也加入了該陣營(yíng)。通過(guò)多達(dá)64顆處理器核心,3200 MT/s內(nèi)存帶來(lái)的9%內(nèi)存性能提高,支持PCIe 4.0實(shí)現(xiàn)的2倍I/O帶寬提升,以及與前代產(chǎn)品相比提升2.4倍的存儲(chǔ)容量,大大提高了虛擬化、HPC和大數(shù)據(jù)等重要工作負(fù)載的性能和效率。
·新的PenguinAltus?XE4218GT支持多達(dá)8個(gè)GPU,使Penguin客戶可以通過(guò) “AMD + AMD”解決方案,使用第二代EPYC和Radeon Instinct MI50加速器支持的PCIe 4.0來(lái)推動(dòng)機(jī)器學(xué)習(xí)、大數(shù)據(jù)分析和類(lèi)似的工作負(fù)載。
·泰安(Tyan)還宣布了其以HPC為重點(diǎn)的Transport HX產(chǎn)品線和以數(shù)據(jù)庫(kù)為重點(diǎn)的Transport SX產(chǎn)品線的新平臺(tái),這些平臺(tái)均由第二代AMD EPYC處理器提供支持。
隨著第二代AMD EPYC處理器和Radeon Instinct GPU加速器實(shí)現(xiàn)了對(duì)PCIe 4.0的支持,AMD與關(guān)鍵行業(yè)合作伙伴緊密攜手,充分引領(lǐng)了PCIe 4.0生態(tài)系統(tǒng)的建設(shè)。第二代EPYC全面支持PCIe 4.0設(shè)備,例如高速以太網(wǎng)和InfiniBand?互連、NIC和交換機(jī)、計(jì)算加速器(GPU和FPGA)和存儲(chǔ)(NVME SSD)設(shè)備。針對(duì)第二代AMD EPYC提供PCIe 4.0產(chǎn)品的合作伙伴包括:
·博通推出了支持200 GB以太網(wǎng)Thor NIC。
·Mellanox ConnectX-6 網(wǎng)卡展現(xiàn)了約400GB/s的InfiniBand性能。
·三星推出Gen4 PM1733 NVME SSD固態(tài)硬盤(pán),展示出兩倍于其第3代 SSD的IOPS(每秒的輸入輸出量)。
·賽靈思Alveo U50、U280 FPGA。