2018年臺(tái)灣GPU技術(shù)大會(huì):美超微展示GPU服務(wù)器平臺(tái)選擇
臺(tái)灣臺(tái)北2018年5月30日電 /美通社/ -- 企業(yè)計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)解決方案以及綠色計(jì)算技術(shù)領(lǐng)域的全球領(lǐng)導(dǎo)者美超微電腦股份有限公司(Super Micro Computer, Inc.) (NASDAQ: SMCI)今天宣布,該公司在2018年臺(tái)灣GPU技術(shù)大會(huì)(GPU Technology Conference (GTC) Taiwan 2018)的白金贊助商展位上,展示業(yè)內(nèi)最為廣泛的GPU服務(wù)器平臺(tái)選擇,而這些GPU服務(wù)器平臺(tái)支持NVIDIA® Tesla® V100 PCI-E和V100 SXM2 Tensor Core GPU加速器,5月30日至31日,2018年臺(tái)灣GPU技術(shù)大會(huì)在臺(tái)北萬(wàn)豪酒店(Taipei Marriott Hotel)舉行。
"Supermicro first with GPU Systems based on Latest Gen CPUs"
美超微采用新一代NVIDIA NVLink™互聯(lián)技術(shù)的全新4U系統(tǒng)為最大限度地提升性能進(jìn)行了優(yōu)化,可以為人工智能、深度學(xué)習(xí)、自動(dòng)駕駛汽車(chē)、智慧城市、醫(yī)療保健、大數(shù)據(jù)、高性能計(jì)算(HPC)和虛擬現(xiàn)實(shí)等高度并行的應(yīng)用進(jìn)行最大限度的加速。作為NVIDIA HGX-T1級(jí)GPU加速服務(wù)器平臺(tái)的一部分,SuperServer 4029GP-TVRT支持8個(gè)NVIDIA Tesla V100 32GB SXM2 GPU加速器,為集群和超大規(guī)模應(yīng)用提供最大的GPU到GPU帶寬。這個(gè)系統(tǒng)結(jié)合了擁有超過(guò)5倍PCI-E 3.0帶寬的最新NVIDIA NVLink技術(shù),采用獨(dú)立的GPU和CPU熱區(qū),確保為要求最高的工作負(fù)載提供不打折扣的強(qiáng)大性能和穩(wěn)定性。
美超微總裁兼首席執(zhí)行官梁見(jiàn)后(Charles Liang)表示:“在最初的內(nèi)部基準(zhǔn)測(cè)試中,我們的4029GP-TVRT系統(tǒng)每秒能夠在ResNet-50上處理5188張圖片,此外還能每秒在IncepTIonV3工作負(fù)載上處理3709張圖片。當(dāng)利用GPU Direct RDMA擴(kuò)展到多個(gè)系統(tǒng)時(shí),我們還實(shí)現(xiàn)了令人印象非常深刻、幾乎呈線(xiàn)性發(fā)展的性能提升。憑借我們結(jié)合新的NVIDIA V100 32GB PCI-E和V100 32GB SXM2 GPU的最新創(chuàng)新成果,并在利用新一代NVLink的性能優(yōu)化1U和4U系統(tǒng)中讓內(nèi)存擴(kuò)大一倍,我們的客戶(hù)可以加速發(fā)展他們的應(yīng)用和創(chuàng)新,從而幫助解決世界上最為復(fù)雜、最具挑戰(zhàn)性的問(wèn)題。”
NVIDIA副總裁、加速計(jì)算部門(mén)總經(jīng)理伊恩-巴克(Ian Buck)則表示:“在美超微為NVIDIA Tesla V100 32GB Tensor Core GPU優(yōu)化的高密度服務(wù)器的支持下,企業(yè)客戶(hù)將能獲益于達(dá)到新層次的計(jì)算效率。內(nèi)存擴(kuò)大一倍,且V100最多推動(dòng)速度提升50%,可以通過(guò)減少內(nèi)存優(yōu)化需求,支持創(chuàng)造復(fù)雜的深度學(xué)習(xí)和科學(xué)應(yīng)用,并提升開(kāi)發(fā)者的工作效率。”
美超微GPU系統(tǒng)還能支持被設(shè)計(jì)用來(lái)在任何橫向擴(kuò)展服務(wù)器中加速推理工作負(fù)載的超高效Tesla P4。Tesla P4中的硬件加速轉(zhuǎn)碼引擎可以實(shí)時(shí)提供35個(gè)高清視頻流,并支持將深度學(xué)習(xí)整合進(jìn)視頻轉(zhuǎn)碼管道,為新的智能視頻應(yīng)用種類(lèi)提供支持。深度學(xué)習(xí)以并非歷史上其它計(jì)算模型的方式塑造我們的世界,更深、更復(fù)雜的神經(jīng)網(wǎng)絡(luò)被訓(xùn)練用來(lái)處理呈指數(shù)增長(zhǎng)的大量數(shù)據(jù)。為了實(shí)現(xiàn)響應(yīng)性,這些模型在強(qiáng)大的美超微GPU服務(wù)器上部署,以便為推理工作負(fù)載提供最大的吞吐量。
美超微還進(jìn)一步展示NVIDIA SCX-E3級(jí)GPU加速服務(wù)器平臺(tái),這種性能優(yōu)化4U SuperServer 4029GR-TRT2系統(tǒng)能夠憑借美超微富有創(chuàng)新精神和經(jīng)過(guò)GPU優(yōu)化的單根復(fù)雜PCI-E設(shè)計(jì),最多支持10個(gè)PCI-E NVIDIA Tesla V100加速器,而這能夠大大提升GPU對(duì)等通信性能。SuperServer 1029GQ-TRT在僅僅1U的機(jī)架空間中最多可以支持4個(gè)NVIDIA Tesla V100 PCI-E GPU加速器,新的SuperServer 1029GQ-TVRT則能在1U機(jī)架空間中支持4個(gè)NVIDIA Tesla V100 SXM2 32GB GPU加速器,進(jìn)一步提升密度,而兩種1029GQ服務(wù)器都是NVIDIA SCX-E2級(jí)GPU加速器平臺(tái)的一部分。
憑借讓大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)、最新NVIDIA GPU架構(gòu)與改進(jìn)后的機(jī)器學(xué)習(xí)算法結(jié)合到一起,深度學(xué)習(xí)應(yīng)用要求獲得多個(gè)GPU的處理能力,必須以富有效力的高效方式擴(kuò)展GPU網(wǎng)絡(luò)。美超微的單根GPU系統(tǒng)可以支持多個(gè)NVIDIA GPU高效聯(lián)系,從而按照NCCL P2PBandwidthTest所測(cè)量的那樣,最大限度地降低延遲水平和提升吞吐量。