中國超算什么時(shí)候能重回第一?一文看懂
11月19日消息 當(dāng)?shù)貢r(shí)間11月18日,由國際超級計(jì)算大會(ISC)公布的新一期全球超級計(jì)算機(jī)500強(qiáng)榜單出爐。中國繼續(xù)擴(kuò)大數(shù)量上的領(lǐng)先優(yōu)勢,在總算力上與美國的差距進(jìn)一步縮小。
美國能源部下屬橡樹嶺國家實(shí)驗(yàn)室開發(fā)的Summit(頂點(diǎn))以每秒14.86億億次的浮點(diǎn)運(yùn)算速度再次登頂,與半年前的速度相同。美國能源部下屬勞倫斯利弗莫爾國家實(shí)驗(yàn)室開發(fā)的Sierra(山脊)、中國超算神威·太湖之光和天河二號分列二三四位。
全球超算500強(qiáng)榜單每半年發(fā)布一次。本次榜單顯示,中國境內(nèi)有228臺超算上榜,在上榜數(shù)量上蟬聯(lián)第一,比半年前的榜單增加9臺。美國以117臺位列第二,日本、法國、德國依次位居其后。這是2017年11月以來,中國超算上榜數(shù)量連續(xù)第五次位居第一。榜單顯示,中國企業(yè)繼續(xù)保持上榜數(shù)量優(yōu)勢。聯(lián)想、中科曙光和浪潮位居全球超算制造商前三位。
什么是超算
超級計(jì)算機(jī)(Super computer),顧名思義,就是具有很強(qiáng)的計(jì)算和處理數(shù)據(jù)能力的計(jì)算機(jī),主要特點(diǎn)表現(xiàn)為高速度和大容量,配有多種外部和外圍設(shè)備及豐富的、高功能的軟件系統(tǒng)。一般來說,超級計(jì)算機(jī)的運(yùn)算速度平均每秒1000萬次以上,存貯容量在1000萬位以上。
從結(jié)構(gòu)上看,超級計(jì)算機(jī)和普通計(jì)算機(jī)都是大同小異的,但它將大量的處理器集中在一起以處理龐大的數(shù)據(jù)量,同時(shí)運(yùn)算速度比常規(guī)計(jì)算機(jī)快許多倍,進(jìn)而影響到各個(gè)行業(yè)運(yùn)行,其意義十分重大。
你認(rèn)為是科技強(qiáng)國的那些國家,就是超算的強(qiáng)國,這兩個(gè)集合是高度重疊的。這也可以反映出超算的重要性,它相當(dāng)于科技界的一種基礎(chǔ)設(shè)施。
從半年前也就是2019年6月開始,超算TOP500的入門門檻超過1PFlops(每秒一千萬億次浮點(diǎn)運(yùn)算),這是全球超算TOP500榜單26年以來的又一歷史性突破。
超算怎么排名?
TOP500是按照什么來給超算排名的?當(dāng)然按照計(jì)算速度了,用專業(yè)語言來說,是每秒能夠執(zhí)行多少次浮點(diǎn)運(yùn)算。
當(dāng)你去看TOP500的榜單時(shí)就會發(fā)現(xiàn),對于每臺超算都列出了兩個(gè)計(jì)算速度,一個(gè)叫做Rmax,一個(gè)叫做Rpeak。例如對于目前排第一的Summit,Rmax是每秒14.86億億次,Rpeak是每秒20億億次。
Rmax是實(shí)測的最高速度,Rpeak是理論上的最高速度??倳行?shí)際原因使超算的性能達(dá)不到理論上限,所以Rmax總是小于Rpeak。因此,TOP500排名用的是實(shí)測的最高速度,也就是Rmax。
超算是不是芯片越多越強(qiáng)悍?
在中國的超算占據(jù)首席的5年中,很多人對此不屑一顧。他們以為超算就是處理器堆出來的,有錢多買些處理器,計(jì)算能力就上去了。他們還以為中國的超算都是買的外國的處理器,因此計(jì)算能力再高也不值一提。
首先,超級計(jì)算機(jī)為什么算得那么快,的確是因?yàn)槌阌昧撕芏鄠€(gè)芯片,讓它們同時(shí)執(zhí)行任務(wù),也就是高性能計(jì)算的基本法則:并行計(jì)算。
超算的單個(gè)芯片的性能跟個(gè)人電腦的芯片差不了太多,而讓多個(gè)芯片進(jìn)行工作,要先給它們劃分好任務(wù),這個(gè)任務(wù)劃分是要消耗時(shí)間的。當(dāng)各個(gè)芯片開始計(jì)算之后,還不時(shí)地要和其他芯片交換數(shù)據(jù),數(shù)據(jù)通信,這是也是要消耗時(shí)間的。
因此,當(dāng)芯片很多的時(shí)候,任務(wù)劃分和數(shù)據(jù)通信會變成瓶頸因素,由此可見,芯片并不是越多越好,光靠堆芯片是堆不出超級計(jì)算機(jī)的,就跟企業(yè)越大,組織層級越多,辦事效率就越低一個(gè)道理。
一臺超算能夠容納下多少芯片,并不是取決于你能買到多少芯片,而是取決于系統(tǒng)架構(gòu)。只有擁有好的系統(tǒng)架構(gòu),你才能擁有更多芯片,也就能擁有更大的算力,所以芯片數(shù)增加不是超算升級的原因,而是結(jié)果。除了芯片之外,架構(gòu)同樣也是核心技術(shù)。
那么中國超算用的是國產(chǎn)芯片嗎?
其次,來說說國產(chǎn)芯片的問題。TOP500上的第三和第四,也就是神威太湖之光和天河二號,它們現(xiàn)在用的都是國產(chǎn)芯—;—;注意是現(xiàn)在。
神威太湖之光用的是中國自主研發(fā)的「申威26010」眾核處理器。它的出現(xiàn)擊碎了外界對于超算芯片國產(chǎn)化的質(zhì)疑。
天河二號以前用的是英特爾的Xeon Phi(至強(qiáng)融核)芯片,在它連續(xù)四次奪冠后,2015年4月,美國商務(wù)部禁止英特爾公司向中國國家超級計(jì)算廣州中心出售至強(qiáng)芯片。長沙中心、廣州中心、天津中心和國防科技大學(xué)這四家國家超算中心,均被美國列入了出口管制名單。
面對來自美國的扼殺,天河二號在2017年底用國產(chǎn)的Matrix-2000協(xié)處理器替換了用了五年的Xeon Phi。這次升級把天河二號的每秒計(jì)算次數(shù)從3.39億億次提升到了6.14億億次,而功耗只增加了不到4%。所以六年了,天河二號還能在TOP500上排到第四,可以說相當(dāng)出色。
另外還要說一句,天河二號取得突破的關(guān)鍵之一是中國自制的TH Express-2主干拓?fù)浣Y(jié)構(gòu)網(wǎng)絡(luò)連接,這項(xiàng)技術(shù)世界領(lǐng)先。所以說,構(gòu)架也是核心技術(shù)就這個(gè)道理。
當(dāng)然你可能又有話要說了,那其他的超算呢?事實(shí)上,出于商業(yè)和應(yīng)用上的考慮,不管是中國還是美國,大多數(shù)企業(yè)部署的超算都趨向于采用成熟的芯片,比如本期TOP500榜單中,94%都使用了英特爾Xeon(至強(qiáng))或Xeon Phi(至強(qiáng)融核)處理器。這是美國在計(jì)算機(jī)芯片研制方面的絕對優(yōu)勢,中國短時(shí)間內(nèi)很難打破。
超算到底有什么用
很多人會問超算到底有什么用。回答是當(dāng)然非常有用了,不然全世界的科技強(qiáng)國紛紛制造超算干嘛呢!
超算在情報(bào)收集、破解領(lǐng)域能力領(lǐng)先,可以強(qiáng)行攻破對方的安全系統(tǒng),棱鏡計(jì)劃暴露了美國政府對公眾隱私和他國公民個(gè)人數(shù)據(jù)的龐大監(jiān)控,這些海量情報(bào)需要進(jìn)行處理,就要用到超算。
說個(gè)離老百姓近的例子,現(xiàn)在的天氣預(yù)報(bào)為什么總那么準(zhǔn),就是超算對云層進(jìn)行精確的模擬和觀測的結(jié)果。通過超算模擬還可以計(jì)算未來一段時(shí)間內(nèi)大氣污染物濃度和分布,進(jìn)行空氣質(zhì)量報(bào)告。
而我們用到的很多先進(jìn)技術(shù)—;—;比如處理器技術(shù)、虛擬技術(shù)包括未來的量子計(jì)算,最早都是超算先用,然后才普及為民用。目前的云計(jì)算和大數(shù)據(jù)同樣也需要超算的算力支持。
醫(yī)療領(lǐng)域,超算已經(jīng)在用于腫瘤研究、DNA測序和藥物研發(fā)等等。此外超算還用于核業(yè)、軍事、航天等高科技領(lǐng)域。
總之,大到模擬宇宙的演變,小到測算一個(gè)分子結(jié)構(gòu),超算發(fā)揮作用的地方可太多了。
超算界有一個(gè)最高級榮譽(yù)—;—;當(dāng)然不是這個(gè)TOP500排名了—;—;叫做戈登·貝爾獎(jiǎng)(Gordon Bell Prize),是授予最杰出的高性能計(jì)算應(yīng)用的,每年頒發(fā)一次。獲得戈登·貝爾獎(jiǎng)的應(yīng)用,一般都在最快的超算上運(yùn)行。
基于神威·太湖之光的兩項(xiàng)應(yīng)用「千萬核可擴(kuò)展全球大氣動力學(xué)全隱式模擬」、「非線性地震模擬」分別在2016年和2017年獲得戈登·貝爾獎(jiǎng)。其中非線性地震模擬,模擬的就是唐山大地震。
中國超算什么時(shí)候能重回第一?
神威太湖之光曾經(jīng)在從2016年6月到2017年11月的四期TOP500榜單中排在首位,四連冠。
天河二號曾經(jīng)在2013年6月至2015年10月的六期榜單中六連冠,直到2016年6月讓位給神威太湖之光,然后一直保持亞軍。
而美國重新奪回TOP500的第一名已經(jīng)是2018年6月的事了,當(dāng)時(shí)外媒鋪天蓋地地報(bào)道,國內(nèi)也有不少人關(guān)注。
自從TOP500開始發(fā)布的1993年以來,美國曾經(jīng)不止一次地失去速度最快的桂冠,但始終保持著上榜數(shù)最多的地位。到了2017年11月,中國第一次在上榜數(shù)目上登頂,美國失去這個(gè)第一。在最新的榜單中,中國擴(kuò)大了上榜數(shù)目的優(yōu)勢,在總算力上接近美國,美國超算占比為37.1%,中國超算占比為32.3%。而半年前,這個(gè)數(shù)據(jù)是美國38.4%,中國29.9%。
從這一點(diǎn)看,中國超算已經(jīng)相當(dāng)強(qiáng)悍,而且繼續(xù)發(fā)展下去很快會在總算力上超越美國。如果你要問中國超算什么時(shí)候拿回TOP500的第一名,機(jī)會不久就會到來,那就是世界超算格局的新變化之一:E級超算的出現(xiàn)。
E級超算,即百億億次超算,被公認(rèn)為超級計(jì)算機(jī)界的下一頂皇冠。從Summit的每秒近15億億次浮點(diǎn)運(yùn)算速度到百億億次,這中間有相當(dāng)大的發(fā)展空間,到E級超算實(shí)現(xiàn)時(shí),將會出現(xiàn)全新的榜單。
美國對此高度重視,相繼宣布建造「極光」、「前沿」和「酋長巖」三臺E級超算,交付時(shí)間預(yù)計(jì)為2021年至2023年。
中國也在已經(jīng)開始E級超算部署三連發(fā),其中E級超算「天河三號」原型機(jī)2018年7月已開放應(yīng)用,「天河三號」有望于2020年研制成功。神威E級原型機(jī)和曙光E級原型機(jī)系統(tǒng)也已完成交付。
下一個(gè)第一,不出意外的話應(yīng)該就在這幾個(gè)名字之間誕生,我們拭目以待。
另外,大家關(guān)注第一的時(shí)候也應(yīng)該清楚,科技競爭不等于戰(zhàn)爭,并沒有真正意義的失敗者,只要你參與競爭,就能從中獲得科技進(jìn)步,分享科技成就。在超算領(lǐng)域,我們已經(jīng)是國際上數(shù)一數(shù)二的競爭者,這本身就非常了不起。而在超算的競爭中,我們同樣能在高性能芯片、構(gòu)架系統(tǒng)、軟件應(yīng)用等眾多方面積累領(lǐng)先的成果,實(shí)現(xiàn)最終理想。