最強AI訓(xùn)練集群 華為Atlas 900首次在AI超算領(lǐng)域應(yīng)用
掃描二維碼
隨時隨地手機看文章
兩個月前的全聯(lián)接大會上,華為發(fā)布了目前全球最快的訓(xùn)練集群Atlas 900。不過,設(shè)計和制造出強大的硬件對于硬件提供商而言并非最困難的事情,能否將其應(yīng)用于不同領(lǐng)域體現(xiàn)出其價值才是成功的標(biāo)志。
本周五,鵬程實驗室聯(lián)合華為在深圳發(fā)布鵬城云腦Ⅱ基本型系統(tǒng)發(fā)布會,這是Atlas 900第一個外部應(yīng)用案例。這不僅代表著華為鯤鵬和昇騰雙引擎計算戰(zhàn)略的向前邁進(jìn),也是華為在5G+AI時代能否保持領(lǐng)先的關(guān)鍵。
Atlas 900落地鵬城云腦Ⅱ
Atlas 900由數(shù)千顆昇騰910 AI處理器互聯(lián)構(gòu)成,每顆昇騰910 AI處理器內(nèi)置32個達(dá)芬奇AI Core,單芯片提供比業(yè)界高一倍的算力(256TFLOPS@FP16),總算力可達(dá)到256P~1024P FLOPS @FP16。Atlas 900發(fā)布時,華為給出的數(shù)據(jù)是在Fastest cluster ResNst-50@ImageNet測試中,華為成績?yōu)?9.8秒,比第二名70.2秒的成績高出了10秒多。
峰值算力和測試成績是判斷硬件性能很好地指標(biāo),但實際中的應(yīng)用效果更為關(guān)鍵。在Atlas 900發(fā)布之時,華為就介紹其聯(lián)合上海天文臺與SKA共同打造的,一張南半球的星空圖有20萬顆星星,當(dāng)前條件下,天文學(xué)家要從這20萬顆星星中,找出某種特征的星體,相當(dāng)困難,需要169天的工作量。用上Atlas 900,只用10秒,就從20萬顆星星中檢索出了相應(yīng)特征的星體。時間從169天縮減到10秒就是Atlas 900實際應(yīng)用效果最直觀地說明。
另外,全聯(lián)接大會上,中國工程院院士、鵬城實驗室主任高文院士也分享了鵬城實驗室基于華為Atlas 900集群打造鵬城云腦Ⅱ的平臺規(guī)劃。兩個月之后的2019年11月29日,鵬城云腦Ⅱ基本型系統(tǒng)正式發(fā)布。高文院士介紹,鵬城云腦Ⅱ原型系統(tǒng)實現(xiàn)了100 PFLOPS的算力,并計劃到明年底擴展至1000 PFLOPS級AI算力。
據(jù)悉,雙方目前正在聯(lián)合攻堅AI集群的規(guī)模進(jìn)化以及AI功能的進(jìn)化,解決散熱、組網(wǎng)等影響集群擴展的關(guān)鍵問題,為實現(xiàn)明年1000 PFLOPS級AI算力。
1000PFLOPS是個什么概念?2019 年6月開始,超算 TOP500 的入門門檻超過 1PFLOPS(每秒一千萬億次浮點運算),這是全球超算 TOP500 榜單 26 年以來的又一歷史性突破。根據(jù)TOP500本月發(fā)布的最新一期超算排行,排名第一的美國超算Summit(頂點)的性能為148.6 PFLOPS。接下來,超算的競賽將進(jìn)入Exascale計算(百萬兆級的計算,也可稱E級超算)時代,也就是1000PFLOPS級。
不過,以Atlas 900為基礎(chǔ)的鵬城云腦Ⅱ是AI計算集群,雖然性能將達(dá)到E級,但主要是面向AI計算,與TOP500的超算系統(tǒng)還有所區(qū)別。
需要補充的是,鵬城云腦是鵬程實驗室的人工智能開放開源平臺,鵬城云腦面向全國,為人工智能基礎(chǔ)研究和應(yīng)用基礎(chǔ)研究提供多層次、多樣化的資源環(huán)境支撐,服務(wù)我國人工智能領(lǐng)域創(chuàng)新發(fā)展。此前的2018年一期工程中,鵬城云腦初步建成上線運行了以“鵬城云腦-1”為核心的P級計算系統(tǒng)。
在鵬城云腦Ⅱ原型系統(tǒng)發(fā)布的當(dāng)天,鵬城實驗室與深圳市政府就一系列重大項目簽約,向衛(wèi)生健康、公安交警、巴士交通、政務(wù)等場景提供鵬城云腦強大的AI算力,支撐市政重大項目智慧升級。
另據(jù)雷鋒網(wǎng)了解,不斷進(jìn)化、動態(tài)升級的鵬城云腦還將持續(xù)向國內(nèi)外的科研機構(gòu)、高等院校等組織提供云端AI算力,充分發(fā)揮華為Atlas 900集群的優(yōu)勢,搭好科學(xué)研究和探索的地基。
華為高級副總裁、Cloud & AI產(chǎn)品與服務(wù)總裁侯金龍(左)與鵬城實驗室主任高文(右)出席鵬城云腦Ⅱ發(fā)布會
Atlas 900與華為5G+AI的未來
至此,Atlas 900已經(jīng)在內(nèi)部和外部都已經(jīng)落地,但其可以更多地應(yīng)用于科學(xué)研究與商業(yè)創(chuàng)新,如天文探索、氣象預(yù)測、自動駕駛、石油勘探等領(lǐng)域。并且在實際應(yīng)用中享受到高算力帶來的優(yōu)勢。
做一個簡單的對比,要實現(xiàn)256 PFLOPS的算力,經(jīng)測算如果使用通用CPU需要6195個機柜,使用GPU需要208個機柜。而基于昇騰架構(gòu)對深度學(xué)習(xí)業(yè)務(wù)的優(yōu)化,以及芯片優(yōu)化之外增加的如板級液冷、柜級密閉絕熱等系統(tǒng)級優(yōu)化, Atlas 900集群使用16個機柜就能實現(xiàn)256 PFLOPS的算力,并且將功耗從40000千瓦降低至736千瓦,實現(xiàn)更高性價比。
當(dāng)然,將Atlas 900中既有昇騰系列AI處理器,也有鯤鵬系列CPU。華為在全聯(lián)接大會上推出了鯤鵬和昇騰雙引擎的計算戰(zhàn)略。華為技術(shù)有限公司Cloud&AI產(chǎn)品與服務(wù)總裁侯金龍近日接受雷鋒網(wǎng)等媒體采訪時表示:“這兩個計算引擎將會應(yīng)用于向各個行業(yè),我們認(rèn)為AI+5G+云會使能各個行業(yè),使各個行業(yè)進(jìn)入智能時代。目前除了鵬城實驗室的鵬城云腦外,金融、智慧城市、電力、交通、互聯(lián)網(wǎng)等行業(yè)都采用了鯤鵬和昇騰這兩個計算引擎?!?/p>
還需指出的是,硬件生態(tài)的強大還需要軟件生態(tài)的協(xié)同,英特爾和英偉達(dá)在高性能計算領(lǐng)域的成功就是很好地例子。因此,在近一年的時間里,華為相繼推出訓(xùn)練和推理框架MindSpore、芯片算子庫和高度自動化算子開發(fā)工具CANN、一站式AI開發(fā)管理平臺ModelArts。并且這些軟件和硬件覆蓋了云、邊、端。
不僅如此,華為還計劃打造強大的生態(tài)。侯金龍介紹,計算產(chǎn)業(yè)的核心就是開發(fā)者生態(tài),華為計劃在未來三年會投資15億美元發(fā)展開發(fā)生態(tài)。希望和各個高校一起,基于鯤鵬和昇騰的計算架構(gòu)體系聯(lián)合各個高校開發(fā)教材,讓學(xué)生至少可以學(xué)習(xí)我們這個體系。
他還透露,明年2月份鵬城云腦和華為會舉辦一個開發(fā)者大會,規(guī)模將超過兩萬人。
雷鋒網(wǎng)小結(jié)
對于任何一家芯片提供商而言,設(shè)計出性能和功耗都具有優(yōu)勢的芯片只是邁向成功的第一步,只有獲得用戶的認(rèn)可并且持續(xù)迭代芯片才能視為芯片的成功。對于華為而且,基于其技術(shù)和客戶的積累,推出新的硬件更容易獲得應(yīng)用,所以我們看到Atlas 900發(fā)布兩個月后就已經(jīng)有兩個應(yīng)用案例。但正如Atlas 900是一個復(fù)雜的系統(tǒng)一樣,華為要在5G和AI的時代勝出,除了硬件,強大的軟件和開發(fā)者生態(tài)都至關(guān)重要,我們也看到了華為在這些方面的投入。至于結(jié)果會如何,我們將保持關(guān)注。