華為Atlas 900 AI集群獲GSMA未來(lái)技術(shù)大獎(jiǎng) 性能超50萬(wàn)臺(tái)PC
2月26日,華為宣布其研發(fā)的Atlas 900 AI集群日前獲得了Global Mobile Awards 2020 (GLOMO獎(jiǎng)項(xiàng))未來(lái)技術(shù)大獎(jiǎng),它是目前全球最快的AI訓(xùn)練集群,使用了華為自研的7nm昇騰910處理器。
本次GLOMO獎(jiǎng)項(xiàng)未來(lái)技術(shù)大獎(jiǎng)由GSMA組織方首次設(shè)定,旨在表彰超越時(shí)代、重塑世界的技術(shù)。
華為表示,Atlas 900 AI集群奪得本屆GLOMO未來(lái)技術(shù)大獎(jiǎng),標(biāo)志著業(yè)界對(duì)其在人工智能領(lǐng)域技術(shù)創(chuàng)新的高度肯定。
Atlas 900是目前全球最快的AI訓(xùn)練集群,它由1024顆昇騰 910 AI處理器構(gòu)成,其總算力可達(dá)256P~1024P FLOPS @FP16,相當(dāng)于50萬(wàn)臺(tái)PC的計(jì)算能力。
據(jù)了解,昇騰910是目前單芯片計(jì)算密度最大的芯片,計(jì)算力遠(yuǎn)超谷歌和英偉達(dá)。昇騰910半精度(FP16)運(yùn)算能力為256TFLOPS,比NVIDIA的Tesla V100要高一倍,整數(shù)精度(INT8)512TOPS,支持128通道全高清視頻解碼(H.264/265),設(shè)計(jì)功耗350W(實(shí)測(cè)達(dá)到規(guī)格算力僅310W)。
在ResNet-50的模型訓(xùn)練基準(zhǔn)測(cè)試中,Atlas 900以59.8秒的成績(jī)打破世界紀(jì)錄,是業(yè)界唯一能在一分鐘內(nèi)完成訓(xùn)練的產(chǎn)品。
它可廣泛應(yīng)用于科學(xué)研究與商業(yè)創(chuàng)新,讓研究人員更快的進(jìn)行圖像、視頻等AI模型訓(xùn)練,讓人類更高效的探索宇宙奧秘、預(yù)測(cè)天氣、勘探石油,加速自動(dòng)駕駛等商用進(jìn)程。
Atlas 900 AI集群采用“HCCS、 PCIe 4.0、100G以太”三類高速互聯(lián)方式,基于CloudEngine系列數(shù)據(jù)中心交換機(jī),打造百TB全互聯(lián)無(wú)阻塞專屬參數(shù)同步網(wǎng)絡(luò),降低網(wǎng)絡(luò)時(shí)延,參數(shù)同步時(shí)延縮短10%~70%,使得AI模型的訓(xùn)練過(guò)程更加高效。
在散熱方面,華為為Atlas 900 AI集群打造出了業(yè)界頂尖的散熱系統(tǒng)。它采用混合液冷方案,創(chuàng)新性設(shè)計(jì)業(yè)界最強(qiáng)柜級(jí)密閉絕熱技術(shù),支撐超過(guò)95%的液冷占比。單機(jī)柜支持高達(dá)50kW的超高散熱功耗,實(shí)現(xiàn)PUE低于1.1的極致數(shù)據(jù)中心能源效率。
與此同時(shí),與8kW風(fēng)冷機(jī)柜相比,可節(jié)省79%的機(jī)房空間。極致的液冷散熱技術(shù)滿足了高功率、高密設(shè)備部署、低PUE的需求,極大地降低了客戶的TCO。