500w神卡!AMD Instinct MI250X/MI250計(jì)算卡曝光
AMD CEO蘇姿豐博士此前曾確認(rèn),會(huì)在明年發(fā)布基于下一代架構(gòu)的全新計(jì)算卡,但未透露更多細(xì)節(jié)。
一直以來不斷有曝料稱,AMD CDNA2架構(gòu)的全新計(jì)算卡代號(hào)Aldebaran(畢宿五),將命名為Instinct MI200,會(huì)采用MCM雙芯整合封裝設(shè)計(jì)。
根據(jù)大神@ExecutableFix的最新情報(bào),AMD全新計(jì)算卡將有兩款,分別叫Instinct MI250X、Instinct MI250,都基于Aldebaran GPU。
其中,MI250X將集成110個(gè)CU計(jì)算單元,并集成創(chuàng)記錄的128GB HBM2e顯存。
這不但是當(dāng)前Instinct MI100 32GB HBM2的整整四倍,還遠(yuǎn)遠(yuǎn)超越競(jìng)品。——NVIDIA A100計(jì)算卡升級(jí)后集成80GB HBM2e,Intel Sapphire Rapids至強(qiáng)則會(huì)集成64GB HBM2e。
另外,MI250X的核心加速頻率為1.7GHz,F(xiàn)P64雙精度浮點(diǎn)性能47.9TFlops,F(xiàn)P32單精度浮點(diǎn)性能95.8TFlops,F(xiàn)P16/BF16半精度浮點(diǎn)性能383TFlops,對(duì)比目前的MI100分別提升大約3.1倍、3.1倍、2.1倍。
不過代價(jià)也比較大,盡管采用了7nm工藝,但是整卡的熱設(shè)計(jì)功耗依然高達(dá)500W,增加了足足三分之二。
至于MI250,應(yīng)該是MI250X的低端版本,或屏蔽部分核心,并降低頻率。
此前,高性能計(jì)算企業(yè)Pawsey SuperComputing透露,他們正在為澳大利亞打造一臺(tái)算力高達(dá)50PFlops(5億億次每秒)的超級(jí)計(jì)算機(jī)“Setonix”(澳洲短尾矮袋鼠),主要用于大數(shù)據(jù)方面的研究工作。
配置方面,這臺(tái)超算計(jì)劃配備超過20萬個(gè)AMD Milan霄龍?zhí)幚砥骱诵模绻琼敿?jí)64核心型號(hào)那就是3000多顆處理器,同時(shí)搭配750多塊AMD MI-Next計(jì)算卡用于加速計(jì)算,而每塊計(jì)算卡擁有128GB顯存,另外還有至少548TB系統(tǒng)內(nèi)存、2.7PB SSD硬盤。
MI-Next這里指的自然就是多次曝光的Instinct MI200,代號(hào)Aldebaran,CDNA2架構(gòu),MCM雙芯封裝,預(yù)計(jì)128個(gè)計(jì)算單元。
就在日前,MI200的內(nèi)核架構(gòu)圖曝光,顯示內(nèi)部確實(shí)有兩個(gè)Die,總共8個(gè)顯存控制器,都是8通道,每通道支持2GB HBM2/HBM2e顯存,最大容量正好就是128GB。
前還不確認(rèn)MI200的具體顯存類型,估計(jì)大概率和NVIDIA一樣也是最新的HBM2e,帶寬預(yù)計(jì)可達(dá)大約2TB/s。
相比之下,AMD現(xiàn)有的CDNA架構(gòu)Instinct MI100計(jì)算卡的顯存是32GB HBM2,帶寬為1.23TB/s。
AMD去年11月發(fā)布了基于全新CDNA計(jì)算架構(gòu)的Instinct MI100,而今隨著游戲卡機(jī)構(gòu)從RDNA2挺進(jìn)RDNA3,新的CDNA2架構(gòu)也在路上,對(duì)應(yīng)產(chǎn)品就是Instinct MI200,代號(hào)為“Aldebaran”(畢宿五)。
CDNA2的設(shè)計(jì)和RDNA3有一點(diǎn)相通,那就是都會(huì)采用MCM多芯封裝方式,內(nèi)部同時(shí)集成兩個(gè)Die,核心規(guī)模輕松翻番,預(yù)計(jì)共有16384個(gè)流處理器核心,MI100則只有7680個(gè)。
顯存方面,MI100配備了32GB HBM2,帶寬高達(dá)1.23TB/s,MI200則會(huì)猛增到128GB,創(chuàng)下全新紀(jì)錄,而且升級(jí)為新一代的HBM2e,帶寬能突破2TB/s。
AMD MI200將搭配下一代霄龍?zhí)幚砥鳎瑯?gòu)建全球首個(gè)百億億次超算Frontier,預(yù)計(jì)今年底推出,還會(huì)有不少其他中小型超算采納,比如澳大利亞的Setonix。
初代CDNA架構(gòu)的計(jì)算卡名為Instinct MI100,代號(hào)“Arcturus”(大角星),7nm工藝,120個(gè)計(jì)算單元,8192個(gè)核心,實(shí)際開啟7680個(gè),搭配4096-bit 32GB HBM2,功耗300W。
CDNA2架構(gòu)的預(yù)計(jì)名為Instinct MI200,代號(hào)“Aldebaran”(畢宿五),首次采用雙芯整合封裝,也就是兩個(gè)GCD,可能有110個(gè)或220個(gè)計(jì)算單元,搭配128GB HBM2e。
消費(fèi)級(jí)的RNA3架構(gòu),也會(huì)采用類似的整合封裝。
AMD ROCm開發(fā)者工具更新也曝光了MI200的四個(gè)不同設(shè)備ID,分別是0x7408、0x740C、0x740F、0x7410,看起來對(duì)應(yīng)四款不同型號(hào)。
CDNA3架構(gòu)的自然應(yīng)該是Instinct MI300,還沒有代號(hào),如果還是沿用紅巨星、紅超巨星的名字,那應(yīng)該是更大的“Rigel”,也就是參宿七/獵戶座β。
更大的還有“Antares”,即心宿二/天蝎座α,以及“Betalgeuse”,即參宿四/獵戶座α。
但傳聞稱,MI300將會(huì)配備四顆芯片,也就是四個(gè)GCD,如此一來理論上核心規(guī)??梢栽俅畏?
MI300應(yīng)該會(huì)在明年底發(fā)布,屆時(shí)將正面競(jìng)爭(zhēng)Intel Xe HPC架構(gòu)的Ponte Vecchio、NVIDIA Hopper架構(gòu)的H100。
CDNA3架構(gòu)如此設(shè)計(jì),RDNA4架構(gòu)應(yīng)該也會(huì)類似,到時(shí)候我們就能看到四芯整合封裝的頂級(jí)游戲卡了
這次發(fā)布了MI250X/MI250計(jì)算卡,真的封神了