AMD Zen 2處理器架構(gòu)為何要如此設(shè)計(jì)？

時(shí)間：2019-07-15 13:19:01

關(guān)鍵字： 2 AMD zen

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]AMD在E3 2019前夕的Next Horizon Gaming大會(huì)上正式發(fā)布了Ryzen 3000系列第三代銳龍桌面處理器，新的處理器擁有最高16核心32線程的規(guī)格，CPU架構(gòu)也從現(xiàn)在的Zen+升

AMD在E3 2019前夕的Next Horizon Gaming大會(huì)上正式發(fā)布了Ryzen 3000系列第三代銳龍桌面處理器，新的處理器擁有最高16核心32線程的規(guī)格，CPU架構(gòu)也從現(xiàn)在的Zen+升級(jí)為Zen 2，性能上會(huì)有明顯的提升，按照AMD提供的數(shù)據(jù)顯示，第三代銳龍桌面處理器的游戲性能已經(jīng)追平甚至超過同價(jià)位下英特爾的第九代酷睿處理器，在創(chuàng)作性能方面則是全面碾壓對(duì)方，在加上主板平臺(tái)支持PCI-E 4.0的優(yōu)勢，從各種意義上說已經(jīng)展現(xiàn)出足夠的優(yōu)勢來超越對(duì)手。

不過當(dāng)我們仔細(xì)去看第三代銳龍桌面處理器時(shí)，我們發(fā)現(xiàn)了一個(gè)很有趣的事情，那就是CPU的內(nèi)部不是一個(gè)封裝在一起的大核心，而是被分為了CPU核心以及I/O核心兩個(gè)部分，其中CPU核心采用的是7nm工藝打造，而I/O核心則采用12nm工藝打造，內(nèi)存控制器也不再整合于CPU核心中，而是被拿出來放到了I/O核心中，通過Data Fabric總線與CPU核心進(jìn)行數(shù)據(jù)交換。

實(shí)際上不僅僅是內(nèi)存控制器與CPU進(jìn)行數(shù)據(jù)交換時(shí)要用到I/O核心上的Data Fabric總線，由于提供PCI-E 4.0通道的PCI-E控制器也整合在I/O核心中，因此CPU、內(nèi)存與GPU直接的數(shù)據(jù)交換都會(huì)通過Data Fabric總線進(jìn)行?？吹竭@里大家是不是覺得這樣的結(jié)構(gòu)有點(diǎn)眼熟呢？是的，此時(shí)處理器的I/O核心實(shí)際上就相當(dāng)于很久之前主板上的北橋芯片，是整個(gè)平臺(tái)的數(shù)據(jù)交換中心，因此我們甚至可以說，第三代銳龍桌面處理器對(duì)應(yīng)的整個(gè)平臺(tái)，似乎又回到了很久之前的“CPU+北橋+南橋”結(jié)構(gòu)。

那么為什么AMD要在自家最新款的桌面處理器中使用這種看起來已經(jīng)落后的結(jié)構(gòu)呢？這點(diǎn)我們不妨從內(nèi)存控制器的發(fā)展進(jìn)程看起，來看看內(nèi)存控制器放在不同的位置會(huì)有些什么優(yōu)點(diǎn)和缺點(diǎn)，這樣或許我們可以更好地理解AMD為什么要在第三代銳龍桌面處理器中，把內(nèi)存處理器放到I/O核心中。

傳統(tǒng)的南北橋主板芯片組時(shí)代

在AMD的K8架構(gòu)處理器、英特爾的第一代酷睿處理器登場之前，他們兩家的CPU平臺(tái)都是最傳統(tǒng)的“CPU+北橋+南橋”結(jié)構(gòu)。此時(shí)的CPU就是純粹的CPU，除了運(yùn)算指令外并不具備其他功能。北橋芯片則是整個(gè)主板的數(shù)據(jù)交換中樞，整合有內(nèi)存控制器以及AGP/PCI-E控制器等重要的控制功能，CPU、GPU與內(nèi)存之間的數(shù)據(jù)交換都要通過北橋芯片進(jìn)行；南橋芯片則用于擴(kuò)展外圍I/O接口，例如SATA和USB接口等。

在這個(gè)時(shí)代，主板能支持什么樣的內(nèi)存和顯卡，都是由北橋芯片決定的，南橋芯片則決定主板可以提供多少外圍I/O接口。因此當(dāng)時(shí)不少主板都是以其北橋芯片來劃分市場的，產(chǎn)品型號(hào)命名上也會(huì)想法嵌入北橋芯片的名字，以此來強(qiáng)調(diào)自己產(chǎn)品的定位。這樣的架構(gòu)同時(shí)也賦予了平臺(tái)極高的靈活性，通過不同的北橋和南橋芯片的搭配，廠商可以進(jìn)一步細(xì)分產(chǎn)品線，同時(shí)舊款的CPU也可以通過用在新主板上的方式來獲得新的功能，例如英特爾Pentium E5200處理器在搭配P965主板使用時(shí)可支持DDR2內(nèi)存，搭配P45主板使用的話就可以使用DDR3內(nèi)存了。

但是這種結(jié)構(gòu)有個(gè)缺點(diǎn)，那就是北橋芯片的負(fù)荷實(shí)在太重了，由于整個(gè)平臺(tái)的數(shù)據(jù)交換都需要經(jīng)過北橋芯片，因此北橋芯片的數(shù)據(jù)帶寬必須要非常充足才能滿足整個(gè)平臺(tái)的使用需求。而隨著各種應(yīng)用對(duì)CPU、內(nèi)存與顯卡性能的需求越來越高，三者之間的數(shù)據(jù)交換速率也越來越快，這種傳統(tǒng)架構(gòu)開始不堪重負(fù)，特別是CPU與內(nèi)存之間的數(shù)據(jù)交換，北橋芯片與CPU之間的總線帶寬越來越難以滿足需求，在一定程度上也制約了CPU性能的發(fā)揮，這時(shí)候就需要一種新的結(jié)構(gòu)來滿足整個(gè)平臺(tái)的性能需求了。

CPU核心整合內(nèi)存控制器時(shí)代

從時(shí)間點(diǎn)來看，AMD要比英特爾更早地在桌面CPU中整合內(nèi)存控制器，早在K8架構(gòu)處理器時(shí)代他們就已經(jīng)這么做了，而那個(gè)時(shí)候英特爾的平臺(tái)還處于傳統(tǒng)的南北橋結(jié)構(gòu)階段，AMD也因此實(shí)現(xiàn)了技術(shù)層面上的逆襲。內(nèi)存控制器整合到CPU內(nèi)部帶來的最大好處，就是CPU與內(nèi)存之間的數(shù)據(jù)訪問延遲得到了大幅度的縮短，兩者的運(yùn)行幾乎達(dá)到了同步的水平，使得CPU核心的性能可以得到完全的發(fā)揮。

同時(shí)由于北橋芯片剝離了內(nèi)存控制器，其負(fù)荷可以說是大大降低了，因此自身的體積、功耗和發(fā)熱量都得到了縮減。但由于本身還需要承擔(dān)PCI-E控制器的功能，因此這個(gè)時(shí)候北橋芯片仍然是區(qū)分主板級(jí)別的重要判定標(biāo)準(zhǔn)，但至少主板能支持什么樣的內(nèi)存，已經(jīng)不再需要由北橋芯片來決定，不同等級(jí)的主板之間的差別在一定程度上是減少了。

英特爾直到第一代酷睿處理器才在CPU中整合了內(nèi)存控制器，同時(shí)也是那個(gè)時(shí)候開始酷睿處理器有了我們熟悉的i3/i5/i7等級(jí)劃分。不過與AMD在整合內(nèi)存控制器后仍然維持南北橋主板芯片組的做法不同，第一代酷睿處理器除了X58平臺(tái)的Core i7-9xx系列外，其余產(chǎn)品都只需要搭配一個(gè)主板芯片即可，因?yàn)橛⑻貭柌粌H在CPU中整合了內(nèi)存控制器，就連PCI-E控制器都已經(jīng)整合到了CPU當(dāng)中（Core i7-9XX系列并無整合PCI-E控制器），所以這個(gè)時(shí)候的CPU就像是“CPU+北橋”的結(jié)合體，不過由于原本北橋芯片的部分功能仍然需要主板芯片來實(shí)現(xiàn)，因此這個(gè)時(shí)候主板芯片的作用就不僅僅是南橋了，而是要比傳統(tǒng)的南橋芯片承擔(dān)更多的工作。

不過第一代酷睿處理器的“整合”也并非是將所有組成都放在一個(gè)核心中，實(shí)際上基于32nm工藝和Clarkdale核心打造的第一代酷睿處理器實(shí)際上還是會(huì)分為CPU+GPU兩個(gè)獨(dú)立的核心，CPU核心提供的仍然是純粹的運(yùn)算功能，而內(nèi)存控制器和PCI-E控制器都位于GPU核心中，但畢竟兩者之間的距離被大大縮短，內(nèi)部走線也可以得到最佳的優(yōu)化，所以從綜合性能仍然有著很明顯的增長。

反觀AMD，雖然他們從K8架構(gòu)就在CPU內(nèi)部整合了內(nèi)存控制器，但是一直到推土機(jī)、打樁機(jī)架構(gòu)CPU，其仍然沒有將PCI-E控制器整合到CPU中，因此從整個(gè)主板的結(jié)構(gòu)來看也仍然是傳統(tǒng)的“CPU+北橋+南橋”設(shè)計(jì)，這對(duì)于主板的生產(chǎn)制造就產(chǎn)生了一定的難度，也不利于整機(jī)綜合性能的進(jìn)一步提升。

全面整合內(nèi)存控制器與PCI-E控制器的時(shí)代

英特爾在經(jīng)歷了第一代酷睿處理器的“CPU+北橋”簡單整合后，從第二代酷睿處理器開始就全面將內(nèi)存控制器、PCI-E控制器與核芯顯卡都整合到了一個(gè)核心當(dāng)中，當(dāng)然為了讓不同主板芯片的檔次得到區(qū)分，有部分平臺(tái)部分功能仍然需要搭配相應(yīng)主板芯片才能實(shí)現(xiàn)，例如只有P系列與Z系列的主板才能支持K系列處理器超頻，而P系列主板不支持核顯輸出等等。

而AMD雖然要到第一代銳龍?zhí)幚砥鞑艑⒈睒蛐酒闹饕δ苷系紺PU當(dāng)中，不過他們家的APU倒是更早地就實(shí)現(xiàn)了相應(yīng)的技術(shù)，在AMD的第一代桌面APU上我們就可以看到其擁有完整的“CPU+GPU+北橋”功能，而且三者是封裝到一個(gè)核心當(dāng)中，有著很高的整合度，相應(yīng)的主板平臺(tái)也因此從“芯片組”變?yōu)榱恕靶酒薄倪@里我們也可以看出，AMD并非在技術(shù)上無法將北橋芯片整合到CPU當(dāng)中，而是出于各種各樣的原因和需求，要到第一代銳龍?zhí)幚砥鞯臅r(shí)候才全面引入這樣的設(shè)計(jì)而已。

AMD：Zen 2架構(gòu)是平衡度最佳的設(shè)計(jì)

現(xiàn)在我們把目光返回到第三代銳龍桌面處理器的身上，從其目前的結(jié)構(gòu)來說，其實(shí)它是用回了類似于英特爾第一代酷睿處理器的結(jié)構(gòu)，就是CPU核心與I/O核心（相當(dāng)于傳統(tǒng)意義上的北橋核心）分別封裝，然后整合到一個(gè)PCB上。從理論上來說，這樣的結(jié)構(gòu)并不利于CPU核心與內(nèi)存控制器之間的數(shù)據(jù)交換，即便在是同一塊PCB上，其內(nèi)存延遲相比整合到CPU核心內(nèi)部是要更高一些的。而且我們也可以看到，如果是對(duì)應(yīng)8核以上產(chǎn)品，那么兩個(gè)CCD之間想要交換數(shù)據(jù)，那么也得通過I/O核心上的Data Fabric總線進(jìn)行，這也不是一個(gè)有利于提升CPU性能的設(shè)計(jì)。從這些方面來看，我們甚至可以說第三代銳龍?zhí)幚砥鞣炊悬c(diǎn)像是走了回頭路。

那么AMD為什么會(huì)采用這種“回頭路”設(shè)計(jì)呢？對(duì)此AMD表示所有的設(shè)計(jì)其實(shí)都在他們的考慮當(dāng)中，實(shí)際上你不能將這些設(shè)計(jì)的任何一個(gè)部分單獨(dú)剝離出去看，你要從整個(gè)CPU的設(shè)計(jì)來進(jìn)行看待，不可否認(rèn)這樣的結(jié)構(gòu)并不是CCD模塊相互之間交換數(shù)據(jù)的最佳設(shè)計(jì)，也不是CPU核心與內(nèi)存控制器通訊的最佳方式，但是在綜合考量多方面的表現(xiàn)后，這種設(shè)計(jì)的平衡度是最佳的，首先憑借CPU內(nèi)部的大緩存設(shè)計(jì)以及Zen 2架構(gòu)種的指令預(yù)測機(jī)制，這些問題其實(shí)很大程度上已經(jīng)得到了解決，最終的CPU性能表現(xiàn)可以說明一切。

其次這是一種靈活度很高的結(jié)構(gòu)，通過不同數(shù)量的CCD核心與I/O核心搭配，是可以輕松衍生出各種不同級(jí)別的產(chǎn)品，例如8核心16線程的處理器，就只需要搭配1個(gè)CCD模塊即可，或者也可以將其中一個(gè)CCD模塊換成GPU，那么就可以衍生出對(duì)應(yīng)的APU產(chǎn)品了。而且這種模塊化的設(shè)計(jì)在更換或去掉其中一個(gè)模塊后，并不會(huì)影響其它模塊的運(yùn)作和性能表現(xiàn)，這讓CPU或者APU的設(shè)計(jì)可以變得更為簡單。

退一步講，目前7nm工藝對(duì)于AMD來說仍然是一種新工藝，產(chǎn)能與成熟度都處于爬升階段，在這個(gè)時(shí)期就應(yīng)該把產(chǎn)能分配最優(yōu)化，把最重要的組成部分放在7nm工藝上，剩下的部分使用更為成熟的12nm工藝，這樣也有利于提升產(chǎn)品的良品率，進(jìn)而提升有效產(chǎn)能，讓玩家可以在第一時(shí)間感受到新架構(gòu)處理器的威力。

那么未來Zen 2架構(gòu)會(huì)不會(huì)有整合度更高的產(chǎn)品呢？AMD方面并未進(jìn)行透露，但可能性還是很大的，例如當(dāng)7nm工藝足夠成熟，產(chǎn)能非常充足的時(shí)候，Zen 2架構(gòu)的CPU和APU很有可能會(huì)回歸到全整合型設(shè)計(jì)。如果真的有那個(gè)時(shí)候，Zen 2架構(gòu)是否還會(huì)迸發(fā)出更高的性能呢？大家不妨拭目以待。