AMD VS 英特爾?本質(zhì)就是一滴水和一片海洋的差距
去年,英特爾發(fā)布了4路和8路的第三代至強(qiáng)(Xeon)可擴(kuò)展處理器,彼時預(yù)告了10nm Ice Lake的發(fā)布。時隔10個月,這一用于單路和雙路系統(tǒng)的第三代至強(qiáng)可擴(kuò)展處理器終于露出廬山真面目。
自從2017年,英特爾推出至強(qiáng)可擴(kuò)展處理器,并將命名改為“銅牌”、“銀牌”、“金牌”、“鉑金”后,現(xiàn)已向全球客戶交付了超過5000萬顆至強(qiáng)可擴(kuò)展處理器。按照英特爾的估計,已有超過800個云服務(wù)提供商部署了基于英特爾至強(qiáng)可擴(kuò)展處理器的服務(wù)器。
在英特爾至強(qiáng)Ice Lake發(fā)布會上,英特爾向數(shù)據(jù)中心市場投下性能“炸彈”,并且不再沉默,與AMD最新發(fā)布的產(chǎn)品“一較高下”。
向數(shù)據(jù)中心投下性能“炸彈”
提到處理器,首要提及的便是性能,硬核的性能永遠(yuǎn)是數(shù)據(jù)中心市場繞不開的話題。從參數(shù)上來看,Ice Lake第三代英特爾至強(qiáng)可擴(kuò)展處理器是針對單路和雙路系統(tǒng)的新產(chǎn)品,采用最先進(jìn)的10nm工藝,最高40核心,單插槽內(nèi)存容量最大支持6TB。
根據(jù)英特爾公司副總裁兼至強(qiáng)處理器與存儲事業(yè)部總經(jīng)理Lisa Spelman的介紹,第三代產(chǎn)品相比第二代至強(qiáng)可擴(kuò)展處理器Cascade Lake核心數(shù)量從4-28個升級到8-40個;L1/L2/L3緩存從32KB/1MB/1.375MB升級到48KB/1.25MB/1.5MB;內(nèi)存通道從6個升級到8個,內(nèi)存速度從2933升級到3200;插槽間互連傳輸速度提高到11.2GT/s;I/O方面支持PCle4.0。
對比自家產(chǎn)品,Intel Xeon Platinum 8380比8280在IPC上擁有20%的提升,平均性能提升46%,AI推理能力增強(qiáng)74%。Intel Xeon Platinum 8380相比5年前的ES-2699v4性能足足提高了2.65倍之多。
既然面向的是數(shù)據(jù)中心,就少不了在細(xì)分市場的優(yōu)化。根據(jù)Lisa Spelman的介紹,第三代至強(qiáng)可擴(kuò)展處理器是首個主流雙插槽并啟用SGX英特爾軟件防護(hù)擴(kuò)展技術(shù)的數(shù)據(jù)中心處理器,內(nèi)置AI加速(Intel DL Boost)進(jìn)行深度學(xué)習(xí)加速,內(nèi)置英特爾密碼操作硬件加速。換言之,這些功能除了帶來AI推力性能加速,還帶來強(qiáng)悍的安全特性。
相比競品性能跨越了“一個海”
提到數(shù)據(jù)中心處理器,難免會聯(lián)想到友商AMD。就在上個月,AMD公布了Zen3架構(gòu)的第三代EPYC宵龍?zhí)幚砥鳌癕ilan米蘭”,彼時AMD宣稱旗下EPYC與英特爾的28核Intel Xeon Platinum 8280強(qiáng)117%。
雷軍曾說過:“生死看淡,不服就干”。實際上,將EPYC 7763與Intel Xeon Platinum 8280對比無異于“田忌賽馬”,只是“跑的最快的馬”和“跑的中速的馬”對比。本次英特爾完善產(chǎn)品線的Ice Lake(Intel Xeon Platinum 8380)可謂是全面碾壓友商。
根據(jù)Lisa Spelman的介紹,第三代至強(qiáng)在深度學(xué)習(xí)和推理方面性能相比AMD EPYC 7763提高了25倍。不過,由于大多數(shù)數(shù)據(jù)科學(xué)家并不運行單一的人工智能工作負(fù)載,因此在經(jīng)過調(diào)查確定20個最常見的機(jī)器和深度學(xué)習(xí)模型中,性能上相比AMD EPYC提高1.5倍。英特爾甚至還拉出來了GPU來比一比,相比Nvidia A100 GPU提升了1.3倍。
有意思的是,為了證明這些數(shù)據(jù)并不是空口無憑,英特爾技術(shù)專家展示出了幾張對比圖全面展示了英特爾在架構(gòu)、緩存和時延上的優(yōu)勢。
首先是在緩存上,Intel Xeon Platinum 8380 Processor在最為關(guān)鍵的L3緩存上響應(yīng)速度遠(yuǎn)高于AMD EPYC 7763 Processor。至強(qiáng)可直接訪問本層緩存,從而獲得一致的響應(yīng)時間、訪問數(shù)據(jù)的時間。
而競品方面,則有8個不同的計算硅芯片,每個都有各自獨立的緩存,這樣就會產(chǎn)生一些問題。假若數(shù)據(jù)在本地緩存中,也就是核心所在方位,響應(yīng)時間就會很短;假若數(shù)據(jù)不在本地緩存中,實際上要請求通過I/O硅芯片到另一個計算硅芯片來檢索數(shù)據(jù),再通過I/O芯片回到發(fā)出申請的內(nèi)核,所以本地緩存訪問和遠(yuǎn)程訪問之間響應(yīng)的時間會差很多。
其次是內(nèi)存上,Intel Xeon Platinum 8380 Processor可以同時以3200Mhz上運行兩條DIMM,而AMD EPYC 7763 Processor宣稱只有一個內(nèi)存通道可以以最快速度運行,當(dāng)運行第二個DIMM時,速度會有所下降,這會降低內(nèi)存的吞吐量。
另外,至強(qiáng)的DRAM時延相比米蘭最高可快30%,這要歸功于至強(qiáng)業(yè)界領(lǐng)先的每個插槽的6TB內(nèi)存。假若客戶通過優(yōu)化軟件,將數(shù)據(jù)儲存在靠近處理器端的插槽,響應(yīng)速度會縮短很多,這樣就能為關(guān)鍵工作負(fù)載提供一致的響應(yīng)的時延。
技術(shù)專家強(qiáng)調(diào),“這些好處不一定在吞吐量的性能上顯示出來,因為吞吐量性能一般來說僅僅增加跨系統(tǒng)的內(nèi)核數(shù)量罷了,而不是考慮它的實際響應(yīng)時間?!?span>
在工作負(fù)載加速方面,英特爾早在三四年前使用VNNI、AVX-512,圍繞這些指令集英特爾建立了非常龐大的軟件生態(tài)系統(tǒng),而這一切都將延續(xù)到Ice Lake上。
技術(shù)專家強(qiáng)調(diào),工作負(fù)載加速器指令就好比性能放大器甚至是“界王拳”,它提供的增益要比僅僅向處理器添加核心所能帶來的增益高很多。
通過指令集優(yōu)化軟件的好處就是可以用更少的內(nèi)核實現(xiàn)更好的性能??梢哉f優(yōu)化過指令集的Intel Xeon Platinum 8380簡直是云服務(wù)和AI推理的“大殺器”,尤其在圖像識別性能上甚至高出了AMD EPYC 7763足足25倍之多。
技術(shù)專家強(qiáng)調(diào),這些結(jié)論實際上都是在產(chǎn)品發(fā)布很久后通過改進(jìn)客戶軟件來持續(xù)優(yōu)化的路線,這些數(shù)據(jù)非常驚人的,在一些人工智能上提高了30倍之多的AI推力性能,10倍更低的時延。
打好產(chǎn)品“組合拳”
性能上“跨一座?!本蛪蛄藛幔繉嶋H上,英特爾打的是產(chǎn)品“組合拳”,“大小搭配干活不累”,多樣化的組合下能夠為數(shù)據(jù)中心市場帶來更多可能性。
其一,截至目前英特爾已經(jīng)可以服務(wù)1、2、4、8個插槽配置,在產(chǎn)品組合上可讓客戶優(yōu)化其節(jié)點大小,實現(xiàn)更高的虛擬機(jī)密度,減少滯留資源,節(jié)約擁有成本。
其二,英特爾至強(qiáng)可擴(kuò)展處理器是一個可拓展且平衡的架構(gòu),通過英特爾6大技術(shù)支柱(制程和封裝、架構(gòu)、內(nèi)存和存儲、互連、安全、軟件)釋放器件最佳的性能。
其三,英特爾作為以IDM 2.0為主旨的公司,擁有多樣化的產(chǎn)品組合,就像“搭積木”一樣將一個又一個超越性能的器件累加便可獲得不止一倍的提升。這就不得不提到這次發(fā)布會被一并發(fā)布的產(chǎn)品。
除了擴(kuò)充了第三代至強(qiáng)可擴(kuò)展處理器,一并被發(fā)布的還有英特爾傲騰持久內(nèi)存200系列、英特爾傲騰SSD P5800X和英特爾SSD 5-P5316、英特爾以太網(wǎng)800系列適配器以及全新的英特爾Agilex FPGA。
上文也有介紹過Ice Lake在內(nèi)存架構(gòu)的優(yōu)勢,那么英特爾傲騰持久內(nèi)存200系列無疑是充分釋放這種架構(gòu)的優(yōu)勢的“好搭檔”。傲騰持久內(nèi)存200是英特爾的下一代持久內(nèi)存模塊,內(nèi)存帶寬增加了32%,每個插槽內(nèi)存容量最高可以達(dá)到6TB,并配備EADR增強(qiáng)型異步DRAM刷新技術(shù)。
在英特爾的“存儲金字塔”上,擁有英特爾傲騰SSD P5800X和英特爾SSD 5-P5316兩款產(chǎn)品。前者是世界上最快的數(shù)據(jù)中心固態(tài)盤,提升了4倍IOPS、6倍TOS,并比NAND固態(tài)盤延遲降低13倍;后者采用了最具密度的NAND截至,與上一代產(chǎn)品擁有5倍耐久性。
高工作負(fù)載之下,需要新的適配器加速高優(yōu)先級別應(yīng)用。英特爾以太網(wǎng)適配器800系列擁有最高200GB/s的數(shù)據(jù)吞吐量,適合高性能 vRAN、NFV轉(zhuǎn)發(fā)面、存儲、高性能計算、云和CDN等應(yīng)用場景,能夠為虛擬機(jī)的密度提供最多兩倍的資源。
FPGA和至強(qiáng)是一對“黃金搭檔”,英特爾早在2019年宣布Agilex FPGA產(chǎn)品,該系列不僅采用最先進(jìn)的10nm SuperFin制程技術(shù),還搭配了Quartus Prime軟件,與競爭對手的7nm FPGA相比,能實現(xiàn)高于2倍的每瓦性能。
除此之外,“芯片荒”成為現(xiàn)在茶余飯后的熱點話題,再強(qiáng)的性能缺乏供應(yīng)鏈也無濟(jì)于事,但英特爾作為半導(dǎo)體龍頭企業(yè)似乎并沒有這方面的擔(dān)心。
英特爾技術(shù)專家表示,“英特爾作為一家集成設(shè)備制造商,我們可以把握自己的命運。比如說我們交付給客戶產(chǎn)品時,可以確定什么時候交付,怎樣優(yōu)先排序,如何更好滿足需求,履行我們的承諾。所以客戶非常重視英特爾的供應(yīng)鏈和物流的能力,因為我們能夠按照時交付他們所需的產(chǎn)品。”
另一方面,最近英特爾新CEO帕特·基辛格在此前宣布將在美國亞利桑那州的Octillo園區(qū)新建兩座晶圓廠,總投資將近200億美元,這也是交付的后備保障。
總結(jié)起來,英特爾此次發(fā)布的第三代至強(qiáng)可擴(kuò)展處理器Ice Lake擁有三方面優(yōu)勢:其一,內(nèi)置AI、安全性,性能強(qiáng)勁;其二,產(chǎn)品組合多樣化;其三,供應(yīng)鏈穩(wěn)定。