PCIe 6.0標(biāo)準(zhǔn)更高帶寬與更低延遲實(shí)現(xiàn)

時(shí)間：2024-07-16 21:25:09

關(guān)鍵字： PCIe 6.0 大數(shù)據(jù)分析視頻渲染

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]隨著大數(shù)據(jù)分析、視頻渲染等技術(shù)的飛速發(fā)展，PCIe6.0標(biāo)準(zhǔn)于去年初正式發(fā)布，相比較上一代PCIe 5.0規(guī)范，帶寬再次翻倍，達(dá)到了64 GT / s。

作為CPU與存儲(chǔ)之間的連接通道，PCIe自推出以來(lái)始終扮演著重要的作用。隨著大數(shù)據(jù)分析、視頻渲染等技術(shù)的飛速發(fā)展，PCIe6.0標(biāo)準(zhǔn)于去年初正式發(fā)布，相比較上一代PCIe 5.0規(guī)范，帶寬再次翻倍，達(dá)到了64 GT / s。

雖說(shuō)PCIe6.0發(fā)布并未引起太多用戶(hù)的關(guān)注，但作為CXL 3.0軟件棧協(xié)議規(guī)范的物理連接承載平臺(tái)，PCI e 6.0將真正承載起CPU與GPU(AI加速器)、CPU與DPU(智能萬(wàn)卡NIC)、以及CXL內(nèi)存模塊(可以理解為其他CPU DDR內(nèi)存)的連接，成為異構(gòu)計(jì)算架構(gòu)下數(shù)據(jù)交互的高速公路。

PCI-SIG 主席兼總裁 Al Yanes 表示，很高興能夠在 PCIe 5.0 規(guī)范發(fā)布不到三年之后推出 PCIe 6.0。新標(biāo)準(zhǔn)有助于降低成本，可幫助數(shù)據(jù)中心、人工智能 / 機(jī)器學(xué)習(xí)、HPC、汽車(chē)、物聯(lián)網(wǎng)以及軍事、航空航天等領(lǐng)域進(jìn)行密集數(shù)據(jù)計(jì)算，同時(shí)保證了與之前幾代技術(shù)的兼容性。

官方表示，固態(tài)硬盤(pán) SSD 市場(chǎng)的飛速增長(zhǎng)，復(fù)合年增長(zhǎng)率達(dá)到 40%。未來(lái)對(duì)速度的要求會(huì)進(jìn)一步提升。PCIe 6.0 標(biāo)準(zhǔn)的推出，將在未來(lái)滿(mǎn)足存儲(chǔ)行業(yè)的需求，提供更高的帶寬和更低延遲。

PCIe技術(shù)，數(shù)據(jù)交互的高速公路

PCIe總線的前身是PCI(Peripheral Component Interconnect)總線協(xié)議，由英特爾于1992年提出，并聯(lián)合業(yè)界合作伙伴成立了名為PCI-SIG (PCI Special Interest Group)(PCI 特殊興趣組J)的企業(yè)聯(lián)盟，負(fù)責(zé)PCI總監(jiān)的標(biāo)準(zhǔn)制定和推廣。

PCI提出的目的是簡(jiǎn)化主板的總線接口，并提高數(shù)據(jù)傳輸總線的性能。由于PCI總線跟ISA總線都使用了并行總線設(shè)計(jì)，所以傳輸速度會(huì)受到影響。此外，PCI總線由于采用了帶寬共享機(jī)制，因此在高負(fù)載下會(huì)出現(xiàn)設(shè)備之間會(huì)搶帶寬的現(xiàn)象。最后，由于PCI不支持熱插拔，因此也不能更好的支持更換磁盤(pán)的操作。

為了解決PCI總線的缺陷，2004年英特爾聯(lián)合伙伴對(duì)PCI技術(shù)進(jìn)行了升級(jí)，正式發(fā)布了 PCI Express(簡(jiǎn)稱(chēng)PCIe)總線，并陸續(xù)推出了PCIe1.0、PCIe2.0、PCIe3.0、PCIe4.0 、PCIe5.0和PCIe6.0規(guī)范，不斷的進(jìn)行帶寬優(yōu)化。

實(shí)際上，近兩年火爆的CXL技術(shù)，其底層就是基于PCIe技術(shù)。隨著大數(shù)據(jù)分析、視頻渲染等技術(shù)的飛速發(fā)展，以及異構(gòu)計(jì)算模式的興起，對(duì)于CPU與GPU、CPU與DPU等之間數(shù)據(jù)交互的帶寬提出了更高的要求。于是，PCIe 6.0 標(biāo)準(zhǔn)應(yīng)運(yùn)而生。

PCIe6.0規(guī)范：更高帶寬與更低延遲

與PCIe5.0相比，PCIe6.0的最大亮點(diǎn)在于將帶寬翻倍提升至64 GT/s。數(shù)據(jù)顯示，PCIe6.0標(biāo)準(zhǔn)的6路雙向傳輸帶寬可達(dá) 256GB/s。由于PCIe的系統(tǒng)性能取決于RTT(Round-TripTime)及有效負(fù)載大小在支持的標(biāo)簽數(shù)量上，因此PCIe6.0變成了基于14位的15,360個(gè)標(biāo)簽數(shù)量(PCIe 5.0擁有768的標(biāo)簽數(shù)量)，滿(mǎn)足了在RTT較長(zhǎng)的情況下也能使系統(tǒng)整體保證高性能的工作狀態(tài)。

為了降低頻率損耗ukjg ,PCIe 6.0采用高階調(diào)制格式PAM4，保證在信號(hào)幅度相同的情況下信噪比下降了約9.5dB。為了解決電源噪聲、串?dāng)_、反射等系統(tǒng)噪音影響，PCIe 6.0規(guī)范在綜合考量了FBER、FIT、FLIT Retry 概率、帶寬效率、Latency 及 FLIT 的 FEC 能力后，采用了輕量級(jí)FEC配合使用循環(huán)冗余碼(CRC)，在降低噪聲敏感性的基礎(chǔ)上將FEC帶給系統(tǒng)延遲控制在2ns之內(nèi)。

此外，PCIe 6.0還引入了FLIT模式(流量控制單元)。與物理層的PAM4不同，F(xiàn)LIT編碼用于邏輯層，將數(shù)據(jù)分解為固定大小的數(shù)據(jù)包。PCIe 6.0以FLIT為單位進(jìn)行事務(wù)傳輸，每個(gè)FLIT有256 B數(shù)據(jù)(1 FLIT=236B TLP+6B DLP+8B CRC+6B FEC=256B)，每B數(shù)據(jù)占用4 UI。此外，F(xiàn)LIT編碼還消除了以前PCIe規(guī)范的128B/130B編碼和DLLP(數(shù)據(jù)鏈路層數(shù)據(jù)包)開(kāi)銷(xiāo)，從而顯著提高了TLP(事務(wù)層數(shù)據(jù)包)效率。

PCIE6.0規(guī)范定義了FBER：1E-6，并引入輕量級(jí)FEC和魯棒性強(qiáng)的CRC算法實(shí)現(xiàn)修正和錯(cuò)誤檢測(cè)。

從PCIe 6.0的規(guī)范我們不難發(fā)現(xiàn)，與前幾代產(chǎn)品相比，技術(shù)上有著巨大的革新。不過(guò)，雖然PCIe 6.0更具優(yōu)勢(shì)，并且已經(jīng)提出一年有余，但時(shí)至當(dāng)下在PCIe 5.0還沒(méi)有完全普及的情況之下，PCIe 6.0何時(shí)才能走進(jìn)用戶(hù)，有著諸多的不確定因素。即使在規(guī)范的發(fā)起者，英特爾在今年剛剛發(fā)布的第四代至強(qiáng)可擴(kuò)展處理器上，也僅支持PCIe 5.0。不過(guò)，這并不影響PCIe 6.0的未來(lái)發(fā)展。筆者認(rèn)為，隨著企業(yè)對(duì)于算力性能的不斷提升，異構(gòu)計(jì)算架構(gòu)的快速普及，PCIe將迎來(lái)巨大的發(fā)展機(jī)遇。

不斷增長(zhǎng)的算力需求，加速PCIe 6.0規(guī)范落地

前文提到了CXL這一當(dāng)前比較火的技術(shù)。實(shí)際上，在CXL短短幾年的發(fā)展中，也經(jīng)歷了不同的階段，并且與PCIe底層技術(shù)有著密切的關(guān)聯(lián)。

如果說(shuō)在CXL1.1中還僅限于單一Node，是一種CPU到CPU，或者CPU到PCIe設(shè)備的cache一致性互聯(lián)，與PCIe關(guān)聯(lián)并不算大之外，那么從CXL2.0技術(shù)開(kāi)始，由于加入了一層(Single Level)的Switch(PCIe Switch)，實(shí)現(xiàn)了多個(gè)設(shè)備連接到一個(gè)root port上，這就與PCIe有著密不可分的關(guān)系。

當(dāng)然，CXL1.1和CXL2.0都是基于PCIe5.0的底層技術(shù)。到了CXL 3.0時(shí)代的每通道吞吐量提升了一倍，達(dá)到64GT/s，便是建立在PCI-Express 6.0之上，并且其將一些復(fù)雜的標(biāo)準(zhǔn)設(shè)計(jì)簡(jiǎn)單化，確保了易用性。

我們知道，CXL創(chuàng)新性的引入了Flex Bus端口，可以靈活的根據(jù)鏈路層協(xié)商決定是采用PCIe協(xié)議還是CXL協(xié)議,這就不難看出，CXL擁有較高的兼容性，更容易被現(xiàn)有支持PCIe端口的處理器(絕大部分的通用CPU、GPU 和 FPGA)所接納。這種創(chuàng)新，也更加有助于用戶(hù)搭建異構(gòu)計(jì)算架構(gòu)，在進(jìn)一步提升算力的同時(shí)，降低數(shù)據(jù)中心的整體能耗。

實(shí)際上，從CXL1.0/1.1、PCIe5.0、CXL2.0以及PCIe6.0CXL3.0的發(fā)展軌跡，我們也可以清晰看出CXL和PCI-e的關(guān)系。PCIe技術(shù)作為CXL技術(shù)的底層基礎(chǔ)，會(huì)更早進(jìn)行迭代升級(jí)。CXL可視為PCI-e技術(shù)的再提高版本，并且，CXL延伸了更多變革性的功能。

進(jìn)入CXL3.0時(shí)代，由于允許更復(fù)雜的連接拓?fù)洌约耙唤MCXL設(shè)備內(nèi)可以靈活實(shí)現(xiàn)Memory sharing(內(nèi)存共享)和內(nèi)存訪問(wèn)，能夠讓多個(gè)Switch互相連接，或者能夠讓上百個(gè)服務(wù)器互聯(lián)并共享內(nèi)存。因此，數(shù)據(jù)中心的算力水平將得到進(jìn)一步提升。因此，英特爾將CXL視為在PCIe物理層之上運(yùn)行的一種可選協(xié)議，也就是說(shuō)PCIe的互聯(lián)協(xié)議沒(méi)有被完全拋棄，并且英特爾還計(jì)劃在PCIe 6.0標(biāo)準(zhǔn)上大力推進(jìn)CXL的采用。

寫(xiě)在最后：雖說(shuō)PCIe 6.0的技術(shù)至今仍舊沒(méi)有看到具體的應(yīng)用落地，但從技術(shù)上來(lái)看，PCIe 6.0標(biāo)準(zhǔn)的發(fā)布將進(jìn)一步提高數(shù)據(jù)中心算力水平，能夠更好地推動(dòng)諸如基因測(cè)序、自動(dòng)駕駛等數(shù)據(jù)爆炸式增長(zhǎng)的場(chǎng)景下對(duì)算力的需求。實(shí)際上，在英特爾規(guī)劃的Diamond Rapids(DMR)上，將會(huì)迎來(lái)一次較大的變革，首次支持PCIe 6.0總線，還會(huì)首次支持CXL 3.0高速接口，而后者正是基于PCIe 6.0而來(lái)。