Intel日前宣布,它將和Cray公司一起為美國能源部的阿貢國家實驗室建造第一臺性能為1 ExaFlops的超級計算機,即每秒可執(zhí)行百億億次浮點運算,比目前的最強超級計算機Summit快5倍以上,預計2021年交付。
Intel表示,這臺價值5億美元的超級計算機名為Aurora,專門為傳統(tǒng)的高性能計算和人工智能設計,它的研制和使用將顯著推進科學研究和發(fā)現(xiàn)。
實際上,這臺Aurora已經(jīng)是升級過的第二版方案,此前Intel原計劃于2018年在阿貢國家實驗室部署一臺基于第三代Knights Hill Xeon Phi協(xié)處理器的超級計算機,峰值性能約180 PetaFlops(每秒18億億次),但在中國宣布計劃2020年前建立百億億次級超級計算機后,感受到來自東方神秘力量的Intel放棄了這一計劃,將設計目標也提升至對位的百億億次級。
Aurora是能源部百億億級計算項目的產(chǎn)物,該項目是PathForward長期計劃中的一項撥款計劃,旨在加速在美國開發(fā)百億億次級超級計算機的研究。從2017年開始,該項目在三年的合同期內(nèi)分配了近2.58億美元的資金,除Intel之外,AMD、Cray、HPE,IBM和NVIDIA等公司均被要求提供至少40%項目總成本的補充融資。
據(jù)了解,自NVIDIA DGX2公布后,高性能計算界開始從純粹追求高性能,轉(zhuǎn)變?yōu)榕cAI尋求更好的結合,美國的Summit超級計算機也不例外。隨著Summit重新奪回了中國占據(jù)多年的TOP500第一名,讓采用CPU+GPU這種異構體系結構的超級計算機成為了絕對主流。
中科院計算機網(wǎng)絡信息中心副主任研究員遲學斌曾提到,Summit這臺機器讓人印象特別深刻的一點是它的實測效率高達70%以上,這在已有的異構系統(tǒng)里應該是最高的一臺。要發(fā)展更高的百億億次級超級計算機的話,其他途徑很難實現(xiàn),只能使用異構體系結構。
Aurora的設計計劃自然將繼續(xù)發(fā)揚這一體系,其核心是Intel下一代至強處理器、下一代Xe GPU以及下一代傲騰存儲器的搭配,將采用Cray公司的Shasta超級計算系統(tǒng)及其Slingshot高性能互連,并完全支持Intel的One API開發(fā)工具,可將計算引擎映射到各種CPU、GPU、FPGA以及其他加速器。
阿貢國家實驗室主任Paul Kearns表示,能源部、阿貢國家實驗室、Intel和Cray公司等行業(yè)合作伙伴的合作,對國家具有巨大的科學效益。Aurora專為下一代人工智能而設計,通過結合高性能計算和人工智能,來解決諸如預測極端天氣、大腦仿真、開發(fā)新材料等實際問題,從而加速科學發(fā)現(xiàn),進一步了解宇宙。
同時了解到,美國最近的大手筆不止Aurora一個。此前,美國能源部向IBM、NVIDIA等公司提供了4.25億美元的聯(lián)邦資金,用于建造兩臺超級計算機:一臺位于能源部的橡樹嶺,另一臺位于勞倫斯利弗莫爾國家實驗室。根據(jù)TOP500超級計算機性能排名,位于橡樹嶺的超級計算機可實現(xiàn)143~200 PetaFlops 的峰值性能,而位于勞倫斯利弗莫爾的紅杉超級計算機峰值性能約為20 PetaFlops。
然而,即便Intel和Cray實現(xiàn)自己的承諾,將Aurora打造成為美國超級計算機皇冠頂上的寶石,但它很可能仍然不是下一代超級計算機中最強大的一臺。據(jù)悉,位于北京的中科院計算所(曙光超級計算機)、天津的國防科大超級計算機中心(天河超級計算機),以及濟南的超級計算機濟南中心(神威超級計算機)三個研發(fā)團隊目前正在積極競爭,要在未來7個月內(nèi)建造百億億次級超級計算機。
此外,日本的百億億次級超級計算機“后京”也計劃于2020年完成部署,雖晚于中國但也要早于Aurora。多方圍剿之下,預計2021年完成部署的Aurora很有可能面臨的是后發(fā)后至的局面。(要不然你再回爐一次?)
如今的超級計算機領域已經(jīng)成為中國和美國之間的競爭舞臺。目前世界上最快的10臺超級計算機中有五臺在美國,其中Summit和Sierra均基于IBM最新的Power9處理器和NVIDIA Volta GV100加速卡打造,峰值性能分別為200 PetaFlops和126 PetaFlops,將占據(jù)HPC TOP500榜首多年的中國超級計算機神威太湖之光擠到了第三位。除此之外,其他三臺還包括第六名的Trinity、第九名的Titan和第十名的Sequoia。
TOP500榜單目前的前十名
位于中國無錫國家超級計算中心的神威太湖之光是目前我國最強的超級計算機,基于自主研發(fā)的申威SW26010處理器,峰值性能125 PetaFlops,曾在2015~2017年蟬聯(lián)TOP500冠軍。緊隨神威太湖之光之后的是排名第四的天河2A,峰值性能100 PetaFlops。
在兩年前的TOP500排名中,中國以202臺的超級計算機數(shù)量首次超過美國的143臺,且這一趨勢在隨后的一年里還有所加速。至2018年秋季 TOP500出爐時,中國上榜的超級計算機總數(shù)再次攀升到229臺,而美國則進一步下降到108臺。
不過,中國雖然在高性能計算領域的硬件上已經(jīng)實現(xiàn)了超車,但在軟件和應用層面上一直與國外有不小的差距,且這種差距并非依靠資金投入便能實現(xiàn)追趕,而是要持續(xù)不斷的慢慢積淀。
以目前的最強超算Summit為例,剛剛投入使用后不久,在去年的全球超級計算大會上便已有一些非常完美的應用展示了出來,例如由美國加州理工大學和國家實驗室設計的項目,使用傳統(tǒng)科學計算和AI計算相結合來預測地震的應用,整體計算使用了傳統(tǒng)科學計算中的有限元,而在單點破壞嚴重的地方則使用了測量數(shù)據(jù)加AI推理,兩者結合之下將Summit這臺機器應用到了完美,并據(jù)此得到了戈登·貝爾獎。
中科曙光副總裁何鐵寧在參觀了這些展示后表示,這些應用最值得學習的地方是如何讓傳統(tǒng)科學計算和AI計算這兩者有機的結合起來,實現(xiàn)比較完美的負載均衡完全匹配。
據(jù)悉,國內(nèi)幾大超級計算中心現(xiàn)在也正向這一模式靠攏,在軟件上的投入逐漸增加,努力完善生態(tài)體系。今年將會有更多的投入在生態(tài)建設上,讓即將到來的三大百億億次級超算發(fā)揮出更強大的威力。