AI時代算力為王 AMD 64核EPYC重新定義高性能計(jì)算
AI時代的算力、算法和數(shù)據(jù)處在一種螺旋式的提升關(guān)系中,雖然芯片制程和計(jì)算性能的提升,使得對算力的渴求不像以前那樣迫切,但當(dāng)算法普及和數(shù)據(jù)累積達(dá)到一個新的程度時,原來的算力又不夠了,成為AI性能提升的硬指標(biāo)。
2019年5月初,AMD度過了自己的50歲生日。創(chuàng)辦50年來,它已經(jīng)成長全球唯一一個擁有高性能CPU和GPU芯片的半導(dǎo)體公司。也是在2019年,AMD推出了7nm Zen2架構(gòu)的新一代霄龍/銳龍?zhí)幚砥?,這是21世紀(jì)以來繼64位K8之后AMD最重要的CPU升級之一。
在7nm Zen2架構(gòu)處理器上,AMD再次將CPU性能和核心數(shù)量提升到了一個新紀(jì)錄上。相比上一代Zen架構(gòu),單核心IPC性能提升15%,相當(dāng)可觀;核心數(shù)量更是直接翻番,第二代EPYC處理器以8的倍數(shù)從8核、16核……到48核,以及最高的64核128線程,可謂豪華。得益于EPYC的設(shè)計(jì)下放到消費(fèi)級產(chǎn)品,主流桌面銳龍也做到了16核32線程,HEDT發(fā)燒平臺做到了24核、32核乃至64核128線程。
在7nm Zen2發(fā)布之后,有分析師評價說,這是AMD 50年來首次在架構(gòu)及工藝上同時領(lǐng)先對手,這在以前是沒有過的。
AMD CEO蘇姿豐在去年的發(fā)布會上表態(tài),AMD已經(jīng)變了,得益于一系列技術(shù)及產(chǎn)品突破,AMD從大家印象中的市場導(dǎo)向型企業(yè)變成了技術(shù)導(dǎo)向型企業(yè),并且是“技術(shù)領(lǐng)導(dǎo)”型企業(yè)。
從2017年正式重返高性能計(jì)算領(lǐng)域,在2年時間里AMD經(jīng)過三代銳龍、兩代霄龍?zhí)幚砥鞯陌l(fā)展,就站上了高性能計(jì)算領(lǐng)域的制高點(diǎn),他們是怎么做到的呢?
7nm Zen2創(chuàng)新制勝:x86首發(fā)小芯片設(shè)計(jì) 64核128線程破紀(jì)錄
在AMD推出Zen架構(gòu)處理器之前,x86 CPU行業(yè)的發(fā)展已經(jīng)停滯多年了。單核性能多年沒有明顯提升,多核也沒有明顯變化,桌面市場10年間都是最多4核8線程,服務(wù)器市場還停留在20+核心時代,業(yè)界無奈稱之為“擠牙膏”,這嚴(yán)重阻礙了x86行業(yè)的發(fā)展。
AMD在第一代Zen上取得了突破,IPC性能大漲52%不說,還順手將CPU核心數(shù)量提升了一倍,桌面普及8核16線程,EPYC霄龍?zhí)幚砥饕沧龅搅?2核64線程,多任務(wù)性能輕松碾壓對手的CPU。
在7nm Zen2處理器上,AMD又實(shí)現(xiàn)了一次性能突破,大膽放棄了傳統(tǒng)設(shè)計(jì)思路,首次在x86行業(yè)使用了chiplets小芯片設(shè)計(jì),CPU計(jì)算核心與IO核心分離,核心數(shù)翻倍,最多64核128線程,再一次將CPU計(jì)算性能推向了新高潮。
以第二代EPYC為例,它的64核架構(gòu)實(shí)際上就是1+8模塊組成的。中間最大的那個是IO核心,稱為IOD(IO Die),使用了12nm工藝制造,根據(jù)需要集成了不同數(shù)量的DDR主控、PCIe主控、IF總線等IO單元,EPYC版的IOD核心面積416mm2,集成340億晶體管。
IO核心周圍的8個模塊則是CPU核心,7nm工藝制造,成為CCD(Core Chiplet Die),每個CCD中有8核16線程CPU,面積74mm2,集成38億晶體管。
這樣一來,AMD在設(shè)計(jì)EPYC處理器的時候就有足夠的靈活性,好像搭積木那樣堆出不同核心的EPYC處理器,以8的倍數(shù),從8核到64核CPU只需考慮不同的IO核心及CCD核心搭配即可。
這種巧妙的設(shè)計(jì)不僅賦予了第二代AMD EPYC處理器靈活性,還大幅降低了成本。根據(jù)AMD的測算,核心數(shù)越多,成本優(yōu)勢就越明顯,64核7nm銳龍作為100%基準(zhǔn)的話,那么48核的成本就是0.9,而原生48核設(shè)計(jì)的成本至少是1.9,比小芯片設(shè)計(jì)高太多了,幾乎翻倍。
當(dāng)然,最重要的一點(diǎn)還有,在第二代EPYC處理器多核性能再次翻倍的同時,單核性能并沒有止步,通過7nm工藝及架構(gòu)改進(jìn),AMD在Zen2上實(shí)現(xiàn)了15%的IPC性能提升,Cinebench基準(zhǔn)測試中實(shí)際提升20%以上。
總之,AMD的64核EPYC處理器憑借7nm Zen2巧妙、靈活的架構(gòu)設(shè)計(jì),再次將高性能計(jì)算能力翻倍,從發(fā)布到現(xiàn)在已經(jīng)打破了至少140項(xiàng)世界計(jì)算紀(jì)錄,并且還在持續(xù)不斷地提升中。
EPYC高性能計(jì)算成功之道:把握技術(shù)趨勢、敢于創(chuàng)新
為何EPYC處理器能夠取得這樣的成功,2011年進(jìn)入AMD公司、2014年擔(dān)任CEO的蘇姿豐(Lisa Su)是最有發(fā)言權(quán)的。此前,對半導(dǎo)體行業(yè)另一個巨頭英特爾來說,發(fā)展是遵循其著名的Tick-Tock戰(zhàn)略的,要么提升芯片制造工藝,要么更新設(shè)計(jì)架構(gòu)。
對AMD來說,他們急需一次爆發(fā),因此公司決定雙管齊下,創(chuàng)造一個全新的產(chǎn)品組合。
蘇姿豐說服了客戶,花費(fèi)數(shù)年時間打造出了這一代7nm Zen2架構(gòu)的處理器。在友商仍然使用14nm工藝的情況下,AMD在升級架構(gòu)的同時,上馬最先進(jìn)的7nm工藝無疑是有極大風(fēng)險的,但最后事實(shí)證明AMD“賭對了”。
對AMD來說,過去幾年最大的收獲就是他們成功制定并實(shí)施了新一代路線圖,從2017年的14nm Zen架構(gòu)開始,AMD在工藝、架構(gòu)上就保持著同步升級的節(jié)奏,改變了業(yè)界Tick-Tock兩年升級一次的慣例。
按照路線圖發(fā)展下去,2020年AMD還會推出7nm工藝的Zen3架構(gòu)的處理器,首發(fā)于第三代EPYC處理器 “Milan” (米蘭)中,今年底應(yīng)該就會上市了。
再往后,AMD也正式宣布了5nm工藝的Zen4架構(gòu),同樣會首先應(yīng)用于第四代EPYC處理器“Genoa”(熱那亞)中。
AI時代來臨 高性能計(jì)算新篇章開啟
憑借7nm Zen2強(qiáng)勁的性能表現(xiàn),AMD贏得了頂級超算的青睞。AMD先后宣布了新一代E級超級計(jì)算機(jī) Frontier和El Capitan,預(yù)期峰值處理能力分別為150億億次FLOPS和200億億次FLOPS以上,計(jì)劃分別于2021年和2023年交付,后者有望在交付后成為世界上速度最快的超級計(jì)算機(jī)。
Frontier將采用下一代EPYC,建成后,通過大幅提升大規(guī)模人工智能、數(shù)據(jù)分析和模擬的性能來實(shí)現(xiàn)科學(xué)突破,幫助科學(xué)家開展更多計(jì)算。
在Frontier創(chuàng)新成果的基礎(chǔ)上,El Capitan采用代號為“Genoa”(熱那亞)的下一代 AMD EPYC處理器以及針對高性能計(jì)算和AI工作負(fù)載而優(yōu)化的新型架構(gòu)的下一代 Radeon Instinct GPU。前者將基于“Zen 4”處理器核心來支持下一代內(nèi)存和 I/O 子系統(tǒng),從而更好地服務(wù)于 AI 和高性能計(jì)算工作負(fù)載,后者將采用下一代高帶寬內(nèi)存以實(shí)現(xiàn)出色的深度學(xué)習(xí)性能。El Capitan這樣的設(shè)計(jì)將在 AI 和機(jī)器學(xué)習(xí)數(shù)據(jù)分析方面實(shí)現(xiàn)飛躍。
接下來的高性能計(jì)算該如何發(fā)展?從Zen2來看,人們對CPU單核及多核心的性能要求已經(jīng)達(dá)到一個比較滿意的地步,現(xiàn)在更關(guān)鍵的是如何利用好這些多核CPU的性能。最有希望的領(lǐng)域應(yīng)該是AI人工智能了,AI時代的算力、算法和數(shù)據(jù)交替上升,對更高算力的需求永不停歇,成為AI性能提升的硬指標(biāo)。
上面提到的Frontier超算性能輕易就達(dá)到了目前排名第一的超算系統(tǒng)Summit的7倍水平,而El Capitan的計(jì)算能力則更高。
AMD CEO蘇姿豐前不久接受采訪時就透露了這方面的信息,她舉了一個前景很誘人的例子,那就是AI人工智能相關(guān)的語音識別,目前處理器文本信息不需要多強(qiáng)的CPU性能,但語音識別這樣的應(yīng)用場景現(xiàn)在多是靠后臺的數(shù)據(jù)中心運(yùn)算的。
如果超算技術(shù)下放到消費(fèi)級產(chǎn)品上,那么語音識別等應(yīng)用就可以利用本地的處理器來計(jì)算,這樣速度、效率就會好很多。
根據(jù)蘇姿豐的預(yù)測,EPYC處理器所代表的高性能計(jì)算會在未來5到10年里深刻影響我們的生活,不僅僅是推動數(shù)據(jù)中心領(lǐng)域的高性能計(jì)算發(fā)展,還會進(jìn)一步促進(jìn)與消費(fèi)級產(chǎn)品的融合,特別是在AI技術(shù)飛速發(fā)展的過程中,無處不在的澎湃算力都是最關(guān)鍵的。