媲美50萬臺PC!一組動圖看懂華為全球最快AI訓(xùn)練集群Atlas 900
9月18日,華為發(fā)布了前全球最快的AI訓(xùn)練集群Atlas 900,可將原本需要耗時數(shù)月的工作縮短到幾秒鐘。
Atlas 900集群采用目前算力最強(qiáng)的AI處理器華為昇騰910,數(shù)千顆互聯(lián),每顆都有32個達(dá)芬奇自主架構(gòu)AI核心,整個集群的FP16半精度浮點(diǎn)算力達(dá)到256-1024PFlops,也就是秒鐘25.6-102.4億億次計(jì)算!這足以相當(dāng)于50萬臺PC的計(jì)算能力。
根據(jù)實(shí)測,它只需59.8秒鐘即可完成基于ImageNet數(shù)據(jù)集訓(xùn)練ResNet-50模型,而競品最快也要超過70秒。
作為大型集群網(wǎng)絡(luò),Atlas 900整合了三種高速互聯(lián)方式,包括單端口速率240Gbps的華為自研HCCS片間互聯(lián)、最新的PCIe 4.0、100G RoCE以太網(wǎng),同時進(jìn)行了系統(tǒng)級調(diào)優(yōu),HCCL通信庫+網(wǎng)絡(luò)拓?fù)洌?xùn)練算法實(shí)現(xiàn)線性度大于80%。
超高的算力對于系統(tǒng)功耗、散熱也是極大的考驗(yàn),Atlas 900采用了業(yè)界頂尖的散熱系統(tǒng),尤其是業(yè)界最強(qiáng)的柜級密閉絕熱技術(shù),液冷占比超過95%,可大幅減少對外散熱,同時高效節(jié)能,單液冷柜支持50千瓦的超高散熱功耗。
華為Atlas 90可廣泛應(yīng)用于科學(xué)研究、商業(yè)創(chuàng)新,比如在天文領(lǐng)域,正在幫助國際組織SKA探索更廣闊的宇宙空間,此外在自動駕駛、氣象預(yù)測、石油勘探等特定領(lǐng)域也能大展拳腳。