ARM取代x86:我看有戲
巴塞隆納超級(jí)運(yùn)算中心(Barcelona Supercomputing Center;BSC)近年來(lái)致力于研發(fā)超級(jí)計(jì)算機(jī)的替代型架構(gòu),也以傳統(tǒng)上應(yīng)用于智能型手機(jī)等客戶端裝置的ARM服務(wù)器芯片,開發(fā)出原型系統(tǒng)架構(gòu)。
據(jù)The Platform報(bào)導(dǎo),低階CPU-GPU混合式系統(tǒng),可望讓ARM架構(gòu)取代傳統(tǒng)高效能運(yùn)算(HPC)的x86架構(gòu),甚至導(dǎo)入比x86-GPU效能更為強(qiáng)大的ARM-GPU系統(tǒng)。BSC認(rèn)為,結(jié)合眾多低階CPU與GPU的系統(tǒng),很可能跟運(yùn)算效能更強(qiáng)的CPU或CPU-GPU混合系統(tǒng)一樣,能處理特定的大型平行運(yùn)算數(shù)據(jù)。
BSC旗下白朗峰計(jì)劃(Mont-Blanc)可望帶動(dòng)新一波計(jì)算機(jī)運(yùn)算趨勢(shì),廠商可選擇較弱的系統(tǒng)節(jié)點(diǎn),而不選擇功能性強(qiáng)大的節(jié)點(diǎn)。而這些會(huì)視平行運(yùn)算應(yīng)用而定,也會(huì)受到每節(jié)點(diǎn)的單線程運(yùn)算效能(single-threaded performance)、內(nèi)存帶寬(memory bandwidth)、以及網(wǎng)絡(luò)帶寬(network bandwidth)影響。
歐洲高速計(jì)算聯(lián)盟(Partnership for Advanced Computing in Europe;PRACE)自2011年開始補(bǔ)助相關(guān)研究,提供1,450萬(wàn)歐元的3年計(jì)劃補(bǔ)助,接著又追加1,130萬(wàn)歐元,補(bǔ)助延展至2016年。歐盟執(zhí)委會(huì)(European Commission;EC)也提供其中1,610萬(wàn)歐元補(bǔ)助原型系統(tǒng)開發(fā)項(xiàng)目。
白朗峰計(jì)劃于2011年以NVIDIA的Fermi GPU跟Tegra3的ARM處理器做為基礎(chǔ),推出首個(gè)原型,而最終的白朗峰原型,搭載2層BullX B505刀鋒服務(wù)器、三星電子(Samsung Electronics)Exynos 5 ARM芯片、4核心Mali-T604 GPU。
白朗峰計(jì)劃希望建立一套原型系統(tǒng),在每7MW(百萬(wàn)瓦)功率電路(power envelope)下可達(dá)每秒50千兆次浮點(diǎn)運(yùn)算(petaflops),而最終目標(biāo)是于2017年打造出一套可在10MW功率電路下達(dá)每秒200千兆次浮點(diǎn)運(yùn)算效能的ARM-GPU運(yùn)算節(jié)點(diǎn)系統(tǒng)。
目前,白朗峰最終原型系統(tǒng)將用于測(cè)試BSC研發(fā)的OmpSs混合運(yùn)算環(huán)境。白朗峰計(jì)劃與協(xié)力伙伴預(yù)計(jì)將導(dǎo)入11項(xiàng)應(yīng)用至原型系統(tǒng),包括電子結(jié)構(gòu)、粒子物理學(xué)、蛋白質(zhì)折迭(protein folding)、波之傳播(wave propagation)等等。
如果價(jià)格、效能與散熱表現(xiàn)合理,針對(duì)服務(wù)器設(shè)計(jì)的ARM 64-bit處理器可望實(shí)現(xiàn)白朗峰目標(biāo)。不過(guò),目前無(wú)人知道PRACE或歐執(zhí)委屆時(shí)是否會(huì)繼續(xù)投資該計(jì)劃,后續(xù)發(fā)展仍待持續(xù)追蹤。