在 PyTorch 上將 AI 算法的實(shí)時(shí)推理速度提升 10 倍,有可能嗎?
前段時(shí)間的CES上,AMD正式發(fā)布Ryzen 7000的3D緩存版,對(duì)于游戲玩家來說,Ryzen 7000 3D緩存版算是今年最期待的CPU。上一代的Ryzen7 5800X3D憑借超強(qiáng)的游戲性能和性價(jià)比,在德國(guó)最大的PC硬件零售商的統(tǒng)計(jì)中,甚至成為2022年最暢銷的高性能處理器。有著Ryzen 5000 3D緩存版的珠玉在前,AMD也是對(duì)這個(gè)系列的迭代產(chǎn)品寄予了厚望,特別是在Ryzen 7000系列銷量并不樂觀的當(dāng)下,3D緩存版幾乎可以說是AMD唯一翻盤的希望。那么Ryzen 7000 3D緩存版的表現(xiàn)到底如何?又是否值得游戲玩家購(gòu)買呢?年度游戲神U預(yù)定?
Ryzen 7000 3D緩存版?zhèn)涫芷诖皇菦]有原因的,以上一代的Ryzen7 5800X3D為例,雖然這款處理器并非AMD的旗艦型號(hào),價(jià)格也僅為449美元(國(guó)行價(jià)格3099元),但是其游戲性能卻可以媲美英特爾的特挑版旗艦處理器i9-12900KS,而且后者的售價(jià)高達(dá)739美元(國(guó)行為5699元)。
以接近一半的價(jià)格提供相同的游戲性能,Ryzen7 5800X3D自然也就得到了許多游戲玩家的追捧。同時(shí),很多玩家也在期待Ryzen 7000 3D緩存版可以延續(xù)Ryzen 5800X3D的“神話”,以50%的價(jià)格在游戲性能上擊敗i9-13900K。
先來看看Ryzen 7000 3D緩存版的規(guī)格,AMD此次發(fā)布的3D緩存版處理器一共三款,分別是Ryzen9 7950X3D、Ryzen9 7900X3D和Ryzen7 7800X3D,對(duì)比上一代新增了兩個(gè)型號(hào),規(guī)格如下:
Ryzen9 7950X3D:16核心32線程,16MB二級(jí)緩存、64MB三級(jí)緩存、64MB 3D緩存,基準(zhǔn)頻率4.2GHz,加速頻率5.7GHz,TDP120W。
Ryzen9 7900X3D:12核心24線程,12MB二級(jí)緩存、64MB三級(jí)緩存、64MB 3D緩存,基準(zhǔn)頻率4.4GHz,加速頻率5.6GHz,TDP120W。
Ryzen7 7800X3D:8核心16線程,8MB二級(jí)緩存、32MB二級(jí)緩存、64MB三級(jí)緩存,基準(zhǔn)頻率未知(官方標(biāo)注為4.xGHz,或許是還未最終確定出廠基準(zhǔn)頻率),加速頻率則是5.0GHz,TDP依然為120W。去年英特爾發(fā)布13代酷睿處理器,帶來多款帶K型號(hào)的旗艦處理器。而最近,英特爾在旗艦之上實(shí)現(xiàn)突破,推出i9-13900KS,主頻高達(dá)6Ghz。
作為i9-13900K的升級(jí)款,KS后綴的處理器是英特爾特挑體質(zhì)處理器,相比普通的i9-13900K默認(rèn)主頻更高,超頻潛力也更大。i9-13900KS在沒有超頻的情況下就能穩(wěn)定6GHz。在規(guī)格方面,i9-13900KS采用8顆性能核加上16顆能效核的24核32線程,相比i9-13900K,基礎(chǔ)頻率從3.0GHz增加到了3.2GHz,擁有UHD770集顯。同時(shí)i9-13900KS擁有更高的默認(rèn)TDP,相較i9-13900K提升25W,達(dá)到150W。
值得注意的是,i9-13900KS還支持極限性能模式,在開啟這個(gè)模式之后,LP1和LP2將會(huì)增加到320W。此外i9-13900KS支持最高DDR5?5600MT/s和DDR4?3200MT/s的內(nèi)存,兼容Z790和Z690主板。
在之前英特爾放出的視頻中,英特爾技術(shù)營(yíng)銷工程師行了演示,搭配華碩Z790商用主板,以及海盜船一體式水冷。在全核心負(fù)載下,性能核的頻率為5.6GHz,能效核的頻率為4.3GHz。在沒有經(jīng)過任何改動(dòng)的情況下,兩個(gè)性能核最高可以達(dá)到6GHz,但頻率并沒有始終保持在這個(gè)水平。英特爾方面解釋說,頻率將取決于許多因素,例如功耗計(jì)算、熱量或軟件本身。
但盡管如此,i9-13900KS的性能依舊令人驚艷。同時(shí)官方表示,憑借現(xiàn)有的英特爾600或全新英特爾700芯片組主板,發(fā)燒友用戶可以暢享第13代英特爾酷睿處理器帶來的出眾性能。產(chǎn)品支持最新的DDR5和既有的DDR4內(nèi)存,用戶在享受第?13?代酷睿所帶來的性能優(yōu)勢(shì)的同時(shí),也可以根據(jù)自己的功能需求和預(yù)算組裝機(jī)器。
2023年初,英特爾醞釀已久的新一代數(shù)據(jù)中心芯片走至臺(tái)前。
1月11日,英特爾正式推出第四代英特爾至強(qiáng)可擴(kuò)展處理器(代號(hào)“Sapphire Rapids”)、英特爾至強(qiáng)CPU Max系列(代號(hào)“Sapphire Rapids HBM”)以及英特爾數(shù)據(jù)中心GPU Max系列(代號(hào)“Ponte Vecchio”)。
一方面,在英特爾的轉(zhuǎn)型中,數(shù)據(jù)中心一直是核心業(yè)務(wù)。根據(jù)英特爾公布的數(shù)據(jù),過去四代所有的至強(qiáng)處理器已經(jīng)銷售了約8500萬顆,其中第三代產(chǎn)品在兩年內(nèi)銷售了1500萬顆。同時(shí),在算力的新需求下,其數(shù)據(jù)中心產(chǎn)品也已經(jīng)從CPU拓展至GPU等,芯片巨頭們都在建立新的生態(tài)體系。
另一方面,在疫情和外部環(huán)境變換之下,半導(dǎo)體產(chǎn)業(yè)整體承壓,尤其是終端需求下滑的情況下,數(shù)據(jù)中心成為半導(dǎo)體行業(yè)的重要增長(zhǎng)點(diǎn),這也成為眾多芯片企業(yè)瞄準(zhǔn)的方向,競(jìng)爭(zhēng)隨之更加猛烈。
根據(jù)Dell’Oro Group此前發(fā)布的報(bào)告,由于運(yùn)營(yíng)商、云計(jì)算廠商運(yùn)算需求持續(xù)提升,到2026年,全球數(shù)據(jù)中心的資本支出預(yù)計(jì)將達(dá)到3770億美元。在數(shù)字化的趨勢(shì)下,算力產(chǎn)業(yè)格局也在重塑中。
在中國(guó)數(shù)據(jù)中心市場(chǎng)上,機(jī)構(gòu)指出2023年有望回暖。IDC中國(guó)研究經(jīng)理索引向21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示:“抗疫政策的轉(zhuǎn)變對(duì)中國(guó)2023年經(jīng)濟(jì)復(fù)蘇帶來了正面影響,2023年我們預(yù)計(jì)中國(guó)整體服務(wù)器市場(chǎng)需求也將出現(xiàn)反彈,出貨量和廠商銷售額分別增長(zhǎng)5.5%和7.2%?!?
企業(yè)數(shù)字化來勢(shì)洶洶,建設(shè)數(shù)字化所需的計(jì)算力、數(shù)據(jù)等智能技術(shù)的基礎(chǔ)設(shè)施常被忽略。
然而,當(dāng)降本增效成為企業(yè)發(fā)展的指導(dǎo)方針之一,數(shù)字化項(xiàng)目落地所涉及的方方面面也已經(jīng)不容小覷。驅(qū)動(dòng)算法與模型的數(shù)據(jù)與算力,也成為實(shí)現(xiàn) " 降本增效 " 的重要手段。
例如,假設(shè)一個(gè)供應(yīng)給終端硬件的視覺算法的交付時(shí)長(zhǎng)是六個(gè)月,算法訓(xùn)練與調(diào)優(yōu)原為 2 個(gè)月,企業(yè)調(diào)配 2 個(gè)算法工程師,一個(gè)算法工程師的年薪為 100 萬,如果算法的訓(xùn)練速度可以提升 10 倍,那么對(duì)企業(yè)所產(chǎn)生的直接影響就是四個(gè)字:真金白銀!
當(dāng)然,這是計(jì)算服務(wù)商一直在努力的目標(biāo)。但,在 PyTorch 上將 AI 算法的實(shí)時(shí)推理速度提升 10 倍,有可能嗎?
英特爾做到了。
在 1 月 11 日舉辦的第四代英特爾 ® 至強(qiáng) ® 可擴(kuò)展處理器新品發(fā)布會(huì)上,英特爾正式推出第四代英特爾 ® 至強(qiáng) ® 可擴(kuò)展處理器、英特爾 ® 至強(qiáng) ® CPU Max 系列以及英特爾 ® 數(shù)據(jù)中心 GPU Max 系列。
第四代至強(qiáng)不僅實(shí)現(xiàn)了 AI 推理的加速,還推動(dòng)了數(shù)據(jù)中心的性能、能效和安全性的大幅躍升,為為 AI、云、網(wǎng)絡(luò)、邊緣和全球領(lǐng)先的超級(jí)計(jì)算機(jī)帶來全新功能。