美國想憑Summit奪回超級計算機霸主地位
美國謀求重新奪回超級計算機霸主地位;
IBM終于開始出貨其獨具風(fēng)格的Power9處理器;
英偉達的Volta GPU將成為Summit和Sierra的主力計算單元。
美國欲憑借Summit超級計算機重回世界之巔
計算機領(lǐng)域的軍備競賽對國際關(guān)系和地緣政治的影響和其它任何常規(guī)軍備競賽一樣重要。這是一場關(guān)于打造出全球最快的超級計算機的競賽。擁有最快的超級計算機不僅僅關(guān)乎民族自豪感,它還具備貨真價實的經(jīng)濟、政治和軍事利益。超級計算機有諸多用武之地,不僅可以用于大范圍地區(qū)的天氣預(yù)報,還可以用于核武器的建模和設(shè)計。
目前,世界上最快的超級計算機是中國的神威·太湖之光,其運算能力能夠達到驚人的93 PetaFLOPS,即每秒執(zhí)行93×10 ^ 15次浮點運算。 2018年,美國計劃在田納西州的橡樹嶺國家實驗室(ORNL)打造出超過神威·太湖之光的超級計算機。這臺名為Summit的超級計算機的運算能力將達到200 PetaFLOPS,同時,加利福尼亞州的勞倫斯利弗莫爾國家實驗室也正在建造一個設(shè)計上與Summit類似的姊妹計算機Sierra。
Summit由大約4600個“節(jié)點”組成,這些節(jié)點基本上都是機架式服務(wù)器。雖然Summit的計算能力將比其前任強大5-10倍,但它的節(jié)點只有前任的1/4,而且耗電量也大大降低。
這臺超級計算機這么強悍,靠的是這些節(jié)點的特殊內(nèi)在。每個節(jié)點都包含一個由IBM設(shè)計的專用HPC(高性能計算)服務(wù)器。 該節(jié)點包含兩個IBM Power9處理器、六個英偉達的Tesla V100 SXM2 GPU加速器,而且整個盒子采用水冷設(shè)計,如文章頂部的硬件照片所示。該硬件最近曾在全球超算大會SC17上展出過。
IBM系統(tǒng)的獨特之處在于,每個Power9處理器都通過英偉達專有的高速NVLink數(shù)字接口直接與英偉達的GPU通信。 這種內(nèi)置功能是Power9獨有的,可通過NVLink 2.0實現(xiàn)100 GB/秒的吞吐能力。
在實際工作中,由這些Power9處理器協(xié)調(diào)每個節(jié)點的計算流程,Tesla V100則負責(zé)繁重的計算工作。IBM將NVLink 2接口集成到芯片上這個設(shè)計決策表明它深諳高性能計算的發(fā)展方向。IBM并沒有抗拒越來越流行使用GPU進行計算的趨勢,而是明智地選擇了它。
IBM終于開始出貨其獨具一格的Power9處理器
每顆Power9處理器本身就是一臺功能強大的計算機,最多可包含24個處理器內(nèi)核,每個內(nèi)核可以并行執(zhí)行四個線程,Power9支持96個線程的并行計算。此外,每顆Power9還支持48路PCIE 4.0通道和8個內(nèi)存通道。
IBM的Power處理器系列基于PowerPC RISC架構(gòu),曾經(jīng)用在蘋果的Mac電腦上,當蘋果公司改用英特爾的x86處理器后,IBM將重點放在了服務(wù)器市場上。
客戶早就對Power9望眼欲穿,IBM去年發(fā)布了這顆芯片,人們普遍預(yù)計IBM將在2017年年底出貨這顆芯片。根據(jù)目前得到的消息,Power9已經(jīng)應(yīng)用在Sierra和Summit上,但是IBM并沒有公布Power9全面供貨的信息,現(xiàn)在業(yè)界認為該芯片可能于2018年初上市銷售。
Power9是一個龐大無比的芯片,這可能是它遲遲沒有面世的原因。 Power9現(xiàn)在采用格羅方德的14納米制程制造。它可能是格羅方德試圖在其14納米節(jié)點工藝上制造的最大的芯片,所以,如果產(chǎn)能和良率達不到IBM的預(yù)期,我一點都不會感到驚訝。同樣影響產(chǎn)能和良率的一個因素是,Power9是一顆龐大而且復(fù)雜的高性能芯片。
英偉達Volta GPU將成為Summit和Sierra的主力計算單元
Summit和Sierra都將使用相似的搭載雙Power9處理器的IBM HPC計算機,它們兩個的主要區(qū)別在于Sierra每個節(jié)點只有四個Tesla V100 GPU,而Summit每個節(jié)點包含六個Tesla V100 SXM2 GPU。雖然GPU數(shù)量更少,但是這種設(shè)計方式可以實現(xiàn)CPU和GPU之間150 GB/秒的NVLink 2通信速度,從而提高吞吐能力。
Tesla V100中的每個GV100 GPU都比Power9更加龐大,正是因為每個V100都需要消耗300瓦的功率,才使用了昂貴的水冷解決方案。據(jù)預(yù)計,整個Summit的的功耗為13兆瓦,而擁有4000-5000個節(jié)點的Sierra的功耗為11兆瓦。就所有實際應(yīng)用而言,Summit和Sierra的計算能力大小主要取決于Tesla V100 GPU的能力限制。
從美國這兩款超級計算機可以一窺英偉達V100 GPU的市場機會。這兩個系統(tǒng)將使用超過45,000個V100 GPU,美國能源部的一位客戶表示,每顆V100 GPU的價格在8000美元左右,這兩臺超級計算機為Tesla V100貢獻的銷售額就超過了3.6億美元。
IBM和英偉達很可能會成為全球超級計算領(lǐng)域的強勢存在,并持續(xù)受益于永無休止的打造更快超級計算機的軍備競賽。