AMD Zen 2處理器架構(gòu)為何要如此設(shè)計(jì)?
AMD在E3 2019前夕的Next Horizon Gaming大會(huì)上正式發(fā)布了Ryzen 3000系列第三代銳龍桌面處理器,新的處理器擁有最高16核心32線程的規(guī)格,CPU架構(gòu)也從現(xiàn)在的Zen+升級(jí)為Zen 2,性能上會(huì)有明顯的提升,按照AMD提供的數(shù)據(jù)顯示,第三代銳龍桌面處理器的游戲性能已經(jīng)追平甚至超過同價(jià)位下英特爾的第九代酷睿處理器,在創(chuàng)作性能方面則是全面碾壓對(duì)方,在加上主板平臺(tái)支持PCI-E 4.0的優(yōu)勢,從各種意義上說已經(jīng)展現(xiàn)出足夠的優(yōu)勢來超越對(duì)手。
不過當(dāng)我們仔細(xì)去看第三代銳龍桌面處理器時(shí),我們發(fā)現(xiàn)了一個(gè)很有趣的事情,那就是CPU的內(nèi)部不是一個(gè)封裝在一起的大核心,而是被分為了CPU核心以及I/O核心兩個(gè)部分,其中CPU核心采用的是7nm工藝打造,而I/O核心則采用12nm工藝打造,內(nèi)存控制器也不再整合于CPU核心中,而是被拿出來放到了I/O核心中,通過Data Fabric總線與CPU核心進(jìn)行數(shù)據(jù)交換。
實(shí)際上不僅僅是內(nèi)存控制器與CPU進(jìn)行數(shù)據(jù)交換時(shí)要用到I/O核心上的Data Fabric總線,由于提供PCI-E 4.0通道的PCI-E控制器也整合在I/O核心中,因此CPU、內(nèi)存與GPU直接的數(shù)據(jù)交換都會(huì)通過Data Fabric總線進(jìn)行??吹竭@里大家是不是覺得這樣的結(jié)構(gòu)有點(diǎn)眼熟呢?是的,此時(shí)處理器的I/O核心實(shí)際上就相當(dāng)于很久之前主板上的北橋芯片,是整個(gè)平臺(tái)的數(shù)據(jù)交換中心,因此我們甚至可以說,第三代銳龍桌面處理器對(duì)應(yīng)的整個(gè)平臺(tái),似乎又回到了很久之前的“CPU+北橋+南橋”結(jié)構(gòu)。
那么為什么AMD要在自家最新款的桌面處理器中使用這種看起來已經(jīng)落后的結(jié)構(gòu)呢?這點(diǎn)我們不妨從內(nèi)存控制器的發(fā)展進(jìn)程看起,來看看內(nèi)存控制器放在不同的位置會(huì)有些什么優(yōu)點(diǎn)和缺點(diǎn),這樣或許我們可以更好地理解AMD為什么要在第三代銳龍桌面處理器中,把內(nèi)存處理器放到I/O核心中。
傳統(tǒng)的南北橋主板芯片組時(shí)代
在AMD的K8架構(gòu)處理器、英特爾的第一代酷睿處理器登場之前,他們兩家的CPU平臺(tái)都是最傳統(tǒng)的“CPU+北橋+南橋”結(jié)構(gòu)。此時(shí)的CPU就是純粹的CPU,除了運(yùn)算指令外并不具備其他功能。北橋芯片則是整個(gè)主板的數(shù)據(jù)交換中樞,整合有內(nèi)存控制器以及AGP/PCI-E控制器等重要的控制功能,CPU、GPU與內(nèi)存之間的數(shù)據(jù)交換都要通過北橋芯片進(jìn)行;南橋芯片則用于擴(kuò)展外圍I/O接口,例如SATA和USB接口等。
在這個(gè)時(shí)代,主板能支持什么樣的內(nèi)存和顯卡,都是由北橋芯片決定的,南橋芯片則決定主板可以提供多少外圍I/O接口。因此當(dāng)時(shí)不少主板都是以其北橋芯片來劃分市場的,產(chǎn)品型號(hào)命名上也會(huì)想法嵌入北橋芯片的名字,以此來強(qiáng)調(diào)自己產(chǎn)品的定位。這樣的架構(gòu)同時(shí)也賦予了平臺(tái)極高的靈活性,通過不同的北橋和南橋芯片的搭配,廠商可以進(jìn)一步細(xì)分產(chǎn)品線,同時(shí)舊款的CPU也可以通過用在新主板上的方式來獲得新的功能,例如英特爾Pentium E5200處理器在搭配P965主板使用時(shí)可支持DDR2內(nèi)存,搭配P45主板使用的話就可以使用DDR3內(nèi)存了。
但是這種結(jié)構(gòu)有個(gè)缺點(diǎn),那就是北橋芯片的負(fù)荷實(shí)在太重了,由于整個(gè)平臺(tái)的數(shù)據(jù)交換都需要經(jīng)過北橋芯片,因此北橋芯片的數(shù)據(jù)帶寬必須要非常充足才能滿足整個(gè)平臺(tái)的使用需求。而隨著各種應(yīng)用對(duì)CPU、內(nèi)存與顯卡性能的需求越來越高,三者之間的數(shù)據(jù)交換速率也越來越快,這種傳統(tǒng)架構(gòu)開始不堪重負(fù),特別是CPU與內(nèi)存之間的數(shù)據(jù)交換,北橋芯片與CPU之間的總線帶寬越來越難以滿足需求,在一定程度上也制約了CPU性能的發(fā)揮,這時(shí)候就需要一種新的結(jié)構(gòu)來滿足整個(gè)平臺(tái)的性能需求了。
CPU核心整合內(nèi)存控制器時(shí)代
從時(shí)間點(diǎn)來看,AMD要比英特爾更早地在桌面CPU中整合內(nèi)存控制器,早在K8架構(gòu)處理器時(shí)代他們就已經(jīng)這么做了,而那個(gè)時(shí)候英特爾的平臺(tái)還處于傳統(tǒng)的南北橋結(jié)構(gòu)階段,AMD也因此實(shí)現(xiàn)了技術(shù)層面上的逆襲。內(nèi)存控制器整合到CPU內(nèi)部帶來的最大好處,就是CPU與內(nèi)存之間的數(shù)據(jù)訪問延遲得到了大幅度的縮短,兩者的運(yùn)行幾乎達(dá)到了同步的水平,使得CPU核心的性能可以得到完全的發(fā)揮。
同時(shí)由于北橋芯片剝離了內(nèi)存控制器,其負(fù)荷可以說是大大降低了,因此自身的體積、功耗和發(fā)熱量都得到了縮減。但由于本身還需要承擔(dān)PCI-E控制器的功能,因此這個(gè)時(shí)候北橋芯片仍然是區(qū)分主板級(jí)別的重要判定標(biāo)準(zhǔn),但至少主板能支持什么樣的內(nèi)存,已經(jīng)不再需要由北橋芯片來決定,不同等級(jí)的主板之間的差別在一定程度上是減少了。
英特爾直到第一代酷睿處理器才在CPU中整合了內(nèi)存控制器,同時(shí)也是那個(gè)時(shí)候開始酷睿處理器有了我們熟悉的i3/i5/i7等級(jí)劃分。不過與AMD在整合內(nèi)存控制器后仍然維持南北橋主板芯片組的做法不同,第一代酷睿處理器除了X58平臺(tái)的Core i7-9xx系列外,其余產(chǎn)品都只需要搭配一個(gè)主板芯片即可,因?yàn)橛⑻貭柌粌H在CPU中整合了內(nèi)存控制器,就連PCI-E控制器都已經(jīng)整合到了CPU當(dāng)中(Core i7-9XX系列并無整合PCI-E控制器),所以這個(gè)時(shí)候的CPU就像是“CPU+北橋”的結(jié)合體,不過由于原本北橋芯片的部分功能仍然需要主板芯片來實(shí)現(xiàn),因此這個(gè)時(shí)候主板芯片的作用就不僅僅是南橋了,而是要比傳統(tǒng)的南橋芯片承擔(dān)更多的工作。
不過第一代酷睿處理器的“整合”也并非是將所有組成都放在一個(gè)核心中,實(shí)際上基于32nm工藝和Clarkdale核心打造的第一代酷睿處理器實(shí)際上還是會(huì)分為CPU+GPU兩個(gè)獨(dú)立的核心,CPU核心提供的仍然是純粹的運(yùn)算功能,而內(nèi)存控制器和PCI-E控制器都位于GPU核心中,但畢竟兩者之間的距離被大大縮短,內(nèi)部走線也可以得到最佳的優(yōu)化,所以從綜合性能仍然有著很明顯的增長。
反觀AMD,雖然他們從K8架構(gòu)就在CPU內(nèi)部整合了內(nèi)存控制器,但是一直到推土機(jī)、打樁機(jī)架構(gòu)CPU,其仍然沒有將PCI-E控制器整合到CPU中,因此從整個(gè)主板的結(jié)構(gòu)來看也仍然是傳統(tǒng)的“CPU+北橋+南橋”設(shè)計(jì),這對(duì)于主板的生產(chǎn)制造就產(chǎn)生了一定的難度,也不利于整機(jī)綜合性能的進(jìn)一步提升。
全面整合內(nèi)存控制器與PCI-E控制器的時(shí)代
英特爾在經(jīng)歷了第一代酷睿處理器的“CPU+北橋”簡單整合后,從第二代酷睿處理器開始就全面將內(nèi)存控制器、PCI-E控制器與核芯顯卡都整合到了一個(gè)核心當(dāng)中,當(dāng)然為了讓不同主板芯片的檔次得到區(qū)分,有部分平臺(tái)部分功能仍然需要搭配相應(yīng)主板芯片才能實(shí)現(xiàn),例如只有P系列與Z系列的主板才能支持K系列處理器超頻,而P系列主板不支持核顯輸出等等。
而AMD雖然要到第一代銳龍?zhí)幚砥鞑艑⒈睒蛐酒闹饕δ苷系紺PU當(dāng)中,不過他們家的APU倒是更早地就實(shí)現(xiàn)了相應(yīng)的技術(shù),在AMD的第一代桌面APU上我們就可以看到其擁有完整的“CPU+GPU+北橋”功能,而且三者是封裝到一個(gè)核心當(dāng)中,有著很高的整合度,相應(yīng)的主板平臺(tái)也因此從“芯片組”變?yōu)榱恕靶酒薄倪@里我們也可以看出,AMD并非在技術(shù)上無法將北橋芯片整合到CPU當(dāng)中,而是出于各種各樣的原因和需求,要到第一代銳龍?zhí)幚砥鞯臅r(shí)候才全面引入這樣的設(shè)計(jì)而已。
AMD:Zen 2架構(gòu)是平衡度最佳的設(shè)計(jì)
現(xiàn)在我們把目光返回到第三代銳龍桌面處理器的身上,從其目前的結(jié)構(gòu)來說,其實(shí)它是用回了類似于英特爾第一代酷睿處理器的結(jié)構(gòu),就是CPU核心與I/O核心(相當(dāng)于傳統(tǒng)意義上的北橋核心)分別封裝,然后整合到一個(gè)PCB上。從理論上來說,這樣的結(jié)構(gòu)并不利于CPU核心與內(nèi)存控制器之間的數(shù)據(jù)交換,即便在是同一塊PCB上,其內(nèi)存延遲相比整合到CPU核心內(nèi)部是要更高一些的。而且我們也可以看到,如果是對(duì)應(yīng)8核以上產(chǎn)品,那么兩個(gè)CCD之間想要交換數(shù)據(jù),那么也得通過I/O核心上的Data Fabric總線進(jìn)行,這也不是一個(gè)有利于提升CPU性能的設(shè)計(jì)。從這些方面來看,我們甚至可以說第三代銳龍?zhí)幚砥鞣炊悬c(diǎn)像是走了回頭路。
那么AMD為什么會(huì)采用這種“回頭路”設(shè)計(jì)呢?對(duì)此AMD表示所有的設(shè)計(jì)其實(shí)都在他們的考慮當(dāng)中,實(shí)際上你不能將這些設(shè)計(jì)的任何一個(gè)部分單獨(dú)剝離出去看,你要從整個(gè)CPU的設(shè)計(jì)來進(jìn)行看待,不可否認(rèn)這樣的結(jié)構(gòu)并不是CCD模塊相互之間交換數(shù)據(jù)的最佳設(shè)計(jì),也不是CPU核心與內(nèi)存控制器通訊的最佳方式,但是在綜合考量多方面的表現(xiàn)后,這種設(shè)計(jì)的平衡度是最佳的,首先憑借CPU內(nèi)部的大緩存設(shè)計(jì)以及Zen 2架構(gòu)種的指令預(yù)測機(jī)制,這些問題其實(shí)很大程度上已經(jīng)得到了解決,最終的CPU性能表現(xiàn)可以說明一切。
其次這是一種靈活度很高的結(jié)構(gòu),通過不同數(shù)量的CCD核心與I/O核心搭配,是可以輕松衍生出各種不同級(jí)別的產(chǎn)品,例如8核心16線程的處理器,就只需要搭配1個(gè)CCD模塊即可,或者也可以將其中一個(gè)CCD模塊換成GPU,那么就可以衍生出對(duì)應(yīng)的APU產(chǎn)品了。而且這種模塊化的設(shè)計(jì)在更換或去掉其中一個(gè)模塊后,并不會(huì)影響其它模塊的運(yùn)作和性能表現(xiàn),這讓CPU或者APU的設(shè)計(jì)可以變得更為簡單。
退一步講,目前7nm工藝對(duì)于AMD來說仍然是一種新工藝,產(chǎn)能與成熟度都處于爬升階段,在這個(gè)時(shí)期就應(yīng)該把產(chǎn)能分配最優(yōu)化,把最重要的組成部分放在7nm工藝上,剩下的部分使用更為成熟的12nm工藝,這樣也有利于提升產(chǎn)品的良品率,進(jìn)而提升有效產(chǎn)能,讓玩家可以在第一時(shí)間感受到新架構(gòu)處理器的威力。
那么未來Zen 2架構(gòu)會(huì)不會(huì)有整合度更高的產(chǎn)品呢?AMD方面并未進(jìn)行透露,但可能性還是很大的,例如當(dāng)7nm工藝足夠成熟,產(chǎn)能非常充足的時(shí)候,Zen 2架構(gòu)的CPU和APU很有可能會(huì)回歸到全整合型設(shè)計(jì)。如果真的有那個(gè)時(shí)候,Zen 2架構(gòu)是否還會(huì)迸發(fā)出更高的性能呢?大家不妨拭目以待。