AMD VS 英特爾？本質(zhì)就是一滴水和一片海洋的差距

時間：2021-04-09 14:46:22

關(guān)鍵字：英特爾至強(qiáng) AMD EPYC

手機(jī)看文章

掃描二維碼
隨時隨地手機(jī)看文章

[導(dǎo)讀]在英特爾至強(qiáng)Ice Lake發(fā)布會上，英特爾向數(shù)據(jù)中心市場投下性能“炸彈”，并且不再沉默，與AMD最新發(fā)布的產(chǎn)品“一較高下”。

去年，英特爾發(fā)布了4路和8路的第三代至強(qiáng)（Xeon）可擴(kuò)展處理器，彼時預(yù)告了10nm Ice Lake的發(fā)布。時隔10個月，這一用于單路和雙路系統(tǒng)的第三代至強(qiáng)可擴(kuò)展處理器終于露出廬山真面目。

自從2017年，英特爾推出至強(qiáng)可擴(kuò)展處理器，并將命名改為“銅牌”、“銀牌”、“金牌”、“鉑金”后，現(xiàn)已向全球客戶交付了超過5000萬顆至強(qiáng)可擴(kuò)展處理器。按照英特爾的估計，已有超過800個云服務(wù)提供商部署了基于英特爾至強(qiáng)可擴(kuò)展處理器的服務(wù)器。

在英特爾至強(qiáng)Ice Lake發(fā)布會上，英特爾向數(shù)據(jù)中心市場投下性能“炸彈”，并且不再沉默，與AMD最新發(fā)布的產(chǎn)品“一較高下”。

向數(shù)據(jù)中心投下性能“炸彈”

提到處理器，首要提及的便是性能，硬核的性能永遠(yuǎn)是數(shù)據(jù)中心市場繞不開的話題。從參數(shù)上來看，Ice Lake第三代英特爾至強(qiáng)可擴(kuò)展處理器是針對單路和雙路系統(tǒng)的新產(chǎn)品，采用最先進(jìn)的10nm工藝，最高40核心，單插槽內(nèi)存容量最大支持6TB。

AMD VS 英特爾？本質(zhì)就是一滴水和一片海洋的差距

根據(jù)英特爾公司副總裁兼至強(qiáng)處理器與存儲事業(yè)部總經(jīng)理Lisa Spelman的介紹，第三代產(chǎn)品相比第二代至強(qiáng)可擴(kuò)展處理器Cascade Lake核心數(shù)量從4-28個升級到8-40個；L1/L2/L3緩存從32KB/1MB/1.375MB升級到48KB/1.25MB/1.5MB；內(nèi)存通道從6個升級到8個，內(nèi)存速度從2933升級到3200；插槽間互連傳輸速度提高到11.2GT/s；I/O方面支持PCle4.0。

對比自家產(chǎn)品，Intel Xeon Platinum 8380比8280在IPC上擁有20%的提升，平均性能提升46%，AI推理能力增強(qiáng)74%。Intel Xeon Platinum 8380相比5年前的ES-2699v4性能足足提高了2.65倍之多。

既然面向的是數(shù)據(jù)中心，就少不了在細(xì)分市場的優(yōu)化。根據(jù)Lisa Spelman的介紹，第三代至強(qiáng)可擴(kuò)展處理器是首個主流雙插槽并啟用SGX英特爾軟件防護(hù)擴(kuò)展技術(shù)的數(shù)據(jù)中心處理器，內(nèi)置AI加速（Intel DL Boost）進(jìn)行深度學(xué)習(xí)加速，內(nèi)置英特爾密碼操作硬件加速。換言之，這些功能除了帶來AI推力性能加速，還帶來強(qiáng)悍的安全特性。

相比競品性能跨越了“一個海”

提到數(shù)據(jù)中心處理器，難免會聯(lián)想到友商AMD。就在上個月，AMD公布了Zen3架構(gòu)的第三代EPYC宵龍?zhí)幚砥鳌癕ilan米蘭”，彼時AMD宣稱旗下EPYC與英特爾的28核Intel Xeon Platinum 8280強(qiáng)117%。

雷軍曾說過：“生死看淡，不服就干”。實際上，將EPYC 7763與Intel Xeon Platinum 8280對比無異于“田忌賽馬”，只是“跑的最快的馬”和“跑的中速的馬”對比。本次英特爾完善產(chǎn)品線的Ice Lake（Intel Xeon Platinum 8380）可謂是全面碾壓友商。

根據(jù)Lisa Spelman的介紹，第三代至強(qiáng)在深度學(xué)習(xí)和推理方面性能相比AMD EPYC 7763提高了25倍。不過，由于大多數(shù)數(shù)據(jù)科學(xué)家并不運行單一的人工智能工作負(fù)載，因此在經(jīng)過調(diào)查確定20個最常見的機(jī)器和深度學(xué)習(xí)模型中，性能上相比AMD EPYC提高1.5倍。英特爾甚至還拉出來了GPU來比一比，相比Nvidia A100 GPU提升了1.3倍。

有意思的是，為了證明這些數(shù)據(jù)并不是空口無憑，英特爾技術(shù)專家展示出了幾張對比圖全面展示了英特爾在架構(gòu)、緩存和時延上的優(yōu)勢。

首先是在緩存上，Intel Xeon Platinum 8380 Processor在最為關(guān)鍵的L3緩存上響應(yīng)速度遠(yuǎn)高于AMD EPYC 7763 Processor。至強(qiáng)可直接訪問本層緩存，從而獲得一致的響應(yīng)時間、訪問數(shù)據(jù)的時間。

而競品方面，則有8個不同的計算硅芯片，每個都有各自獨立的緩存，這樣就會產(chǎn)生一些問題。假若數(shù)據(jù)在本地緩存中，也就是核心所在方位，響應(yīng)時間就會很短；假若數(shù)據(jù)不在本地緩存中，實際上要請求通過I/O硅芯片到另一個計算硅芯片來檢索數(shù)據(jù)，再通過I/O芯片回到發(fā)出申請的內(nèi)核，所以本地緩存訪問和遠(yuǎn)程訪問之間響應(yīng)的時間會差很多。

AMD VS 英特爾？本質(zhì)就是一滴水和一片海洋的差距

其次是內(nèi)存上，Intel Xeon Platinum 8380 Processor可以同時以3200Mhz上運行兩條DIMM，而AMD EPYC 7763 Processor宣稱只有一個內(nèi)存通道可以以最快速度運行，當(dāng)運行第二個DIMM時，速度會有所下降，這會降低內(nèi)存的吞吐量。

另外，至強(qiáng)的DRAM時延相比米蘭最高可快30%，這要歸功于至強(qiáng)業(yè)界領(lǐng)先的每個插槽的6TB內(nèi)存。假若客戶通過優(yōu)化軟件，將數(shù)據(jù)儲存在靠近處理器端的插槽，響應(yīng)速度會縮短很多，這樣就能為關(guān)鍵工作負(fù)載提供一致的響應(yīng)的時延。

技術(shù)專家強(qiáng)調(diào)，“這些好處不一定在吞吐量的性能上顯示出來，因為吞吐量性能一般來說僅僅增加跨系統(tǒng)的內(nèi)核數(shù)量罷了，而不是考慮它的實際響應(yīng)時間?！?span>

AMD VS 英特爾？本質(zhì)就是一滴水和一片海洋的差距

在工作負(fù)載加速方面，英特爾早在三四年前使用VNNI、AVX-512，圍繞這些指令集英特爾建立了非常龐大的軟件生態(tài)系統(tǒng)，而這一切都將延續(xù)到Ice Lake上。

技術(shù)專家強(qiáng)調(diào)，工作負(fù)載加速器指令就好比性能放大器甚至是“界王拳”，它提供的增益要比僅僅向處理器添加核心所能帶來的增益高很多。

AMD VS 英特爾？本質(zhì)就是一滴水和一片海洋的差距

通過指令集優(yōu)化軟件的好處就是可以用更少的內(nèi)核實現(xiàn)更好的性能?？梢哉f優(yōu)化過指令集的Intel Xeon Platinum 8380簡直是云服務(wù)和AI推理的“大殺器”，尤其在圖像識別性能上甚至高出了AMD EPYC 7763足足25倍之多。

技術(shù)專家強(qiáng)調(diào)，這些結(jié)論實際上都是在產(chǎn)品發(fā)布很久后通過改進(jìn)客戶軟件來持續(xù)優(yōu)化的路線，這些數(shù)據(jù)非常驚人的，在一些人工智能上提高了30倍之多的AI推力性能，10倍更低的時延。

AMD VS 英特爾？本質(zhì)就是一滴水和一片海洋的差距

打好產(chǎn)品“組合拳”

性能上“跨一座?！本蛪蛄藛幔繉嶋H上，英特爾打的是產(chǎn)品“組合拳”，“大小搭配干活不累”，多樣化的組合下能夠為數(shù)據(jù)中心市場帶來更多可能性。

其一，截至目前英特爾已經(jīng)可以服務(wù)1、2、4、8個插槽配置，在產(chǎn)品組合上可讓客戶優(yōu)化其節(jié)點大小，實現(xiàn)更高的虛擬機(jī)密度，減少滯留資源，節(jié)約擁有成本。

其二，英特爾至強(qiáng)可擴(kuò)展處理器是一個可拓展且平衡的架構(gòu)，通過英特爾6大技術(shù)支柱（制程和封裝、架構(gòu)、內(nèi)存和存儲、互連、安全、軟件）釋放器件最佳的性能。

其三，英特爾作為以IDM 2.0為主旨的公司，擁有多樣化的產(chǎn)品組合，就像“搭積木”一樣將一個又一個超越性能的器件累加便可獲得不止一倍的提升。這就不得不提到這次發(fā)布會被一并發(fā)布的產(chǎn)品。

除了擴(kuò)充了第三代至強(qiáng)可擴(kuò)展處理器，一并被發(fā)布的還有英特爾傲騰持久內(nèi)存200系列、英特爾傲騰SSD P5800X和英特爾SSD 5-P5316、英特爾以太網(wǎng)800系列適配器以及全新的英特爾Agilex FPGA。

上文也有介紹過Ice Lake在內(nèi)存架構(gòu)的優(yōu)勢，那么英特爾傲騰持久內(nèi)存200系列無疑是充分釋放這種架構(gòu)的優(yōu)勢的“好搭檔”。傲騰持久內(nèi)存200是英特爾的下一代持久內(nèi)存模塊，內(nèi)存帶寬增加了32%，每個插槽內(nèi)存容量最高可以達(dá)到6TB，并配備EADR增強(qiáng)型異步DRAM刷新技術(shù)。

在英特爾的“存儲金字塔”上，擁有英特爾傲騰SSD P5800X和英特爾SSD 5-P5316兩款產(chǎn)品。前者是世界上最快的數(shù)據(jù)中心固態(tài)盤，提升了4倍IOPS、6倍TOS，并比NAND固態(tài)盤延遲降低13倍；后者采用了最具密度的NAND截至，與上一代產(chǎn)品擁有5倍耐久性。

高工作負(fù)載之下，需要新的適配器加速高優(yōu)先級別應(yīng)用。英特爾以太網(wǎng)適配器800系列擁有最高200GB/s的數(shù)據(jù)吞吐量，適合高性能 vRAN、NFV轉(zhuǎn)發(fā)面、存儲、高性能計算、云和CDN等應(yīng)用場景，能夠為虛擬機(jī)的密度提供最多兩倍的資源。

FPGA和至強(qiáng)是一對“黃金搭檔”，英特爾早在2019年宣布Agilex FPGA產(chǎn)品，該系列不僅采用最先進(jìn)的10nm SuperFin制程技術(shù)，還搭配了Quartus Prime軟件，與競爭對手的7nm FPGA相比，能實現(xiàn)高于2倍的每瓦性能。

除此之外，“芯片荒”成為現(xiàn)在茶余飯后的熱點話題，再強(qiáng)的性能缺乏供應(yīng)鏈也無濟(jì)于事，但英特爾作為半導(dǎo)體龍頭企業(yè)似乎并沒有這方面的擔(dān)心。

英特爾技術(shù)專家表示，“英特爾作為一家集成設(shè)備制造商，我們可以把握自己的命運。比如說我們交付給客戶產(chǎn)品時，可以確定什么時候交付，怎樣優(yōu)先排序，如何更好滿足需求，履行我們的承諾。所以客戶非常重視英特爾的供應(yīng)鏈和物流的能力，因為我們能夠按照時交付他們所需的產(chǎn)品。”

另一方面，最近英特爾新CEO帕特·基辛格在此前宣布將在美國亞利桑那州的Octillo園區(qū)新建兩座晶圓廠，總投資將近200億美元，這也是交付的后備保障。

總結(jié)起來，英特爾此次發(fā)布的第三代至強(qiáng)可擴(kuò)展處理器Ice Lake擁有三方面優(yōu)勢：其一，內(nèi)置AI、安全性，性能強(qiáng)勁；其二，產(chǎn)品組合多樣化；其三，供應(yīng)鏈穩(wěn)定。