圖靈顯卡+光線追蹤會有哪些驚喜,RTX 2080 Ti/2080同步評測揭曉!
大家期待了兩年的NVIDIA新顯卡,終于在今天正式解禁了性能評測,中間跳過了Votla架構后,Turing架構橫空出世,帶著圖靈極具革命性的創(chuàng)新思想,全球第一款支持實時光線追蹤的顯卡RTX 2080 Ti、RTX 2080誕生了。那么在新架構、新工藝下的Turing圖靈顯卡將會與光線追蹤迸發(fā)出什么樣的火花?性能上會有怎樣的驚喜?一切都會在這篇同步評測中揭曉。
在過去10年,NVIDIA一直都在堅持使用GeForce GTX作為顯卡的前綴,這一次改名GeForce RTX顯示了他們內心的激動、以及改變游戲界現狀那種自豪,“R”顯然代表著“Real-Time Ray Tracing(實時光線追蹤)”,代表著NVIDIA過去十年的努力,這一刻終于呈現給了我們的游戲玩家。
NVIDIA CEO黃仁勛在發(fā)布現場興奮地說,Turing顯卡是過去12年里GPU最大的飛躍。
所以,這一代Turing圖靈顯卡最大亮點就是實現了游戲畫質飛躍式進步的前提——支持實時光線追蹤,也是最大的亮點。下面是我們針對RTX 2080 Ti、RTX 2080“光追”顯卡,對比上一代同級Pascal顯卡的規(guī)格對比表。
RTX 2080 Ti、RTX 2080規(guī)格:
首先Turing顯卡最明顯的變化就是,目前是一個核心對應一個型號,TU102是RTX 2080 Ti專屬、TU104為RTX 2080專屬,TU106為RTX 2070專屬,而上一代GTX 1080、GTX 1070共用同一款GP104核心。
Turing顯卡將會采用12nm FFN工藝打造,技術供應方來自臺積電,12nm FFN其實還是基于16nm FF+演進過來,12nm FFN最后的“N”代表著這是專門為NVIDIA優(yōu)化的高性能版本。
盡管有了新制程的支持,Turing GPU核心面積也是水漲船高,雖然還沒有達到TITAN V GV100核心那種815mm2級別,但也相差不遠了,RTX 2080 Ti的TU102足足有754mm2,RTX 2080使用的TU104也有545mm2,因此晶體管數量達到了空前的186億、136億,像RTX 2080比起GTX 1080都快翻倍了。
冷靜地分析一下,Turing核心面積暴漲原因其實并不是暴力堆砌CUDA單元結果,而是引入了全新的Tensor Core以及RT Core單元有極大關系。而它們的出現成就了Turing圖靈顯卡最大亮點——游戲也可AI、實時光線追蹤不是夢!
TU102核心架構
之前我們都說過三款新顯卡都有不同的GPU核心,其實它們內部結構都是發(fā)生了很大變化。RTX 2080 Ti TU102核心規(guī)模真的非常大,TU102核心一共分為6組GPC單元,每組GPC單元又擁有12個SM單元,一共是72個SM單元,但RTX 2080 Ti也只用到其中的68個而已,算下來68×64=4352個CUDA流處理器。同時按照RTX 2080 Ti已經公布的參數,可以計算得出,每個SM單元將會配備64個CUDA、8個Tensor Core 、1個RT Core,每個SM單元配給64個CUDA的做法,倒像是從前GP100大核心喜歡做的事情,原因會在后面給出。
TU102
TU102核心架構
完整版的TU104核心依然是6組GPC單元,不過每組GPC改為8個SM單元,一共是6×8=48個,而RTX 2080的GPU核心是TU104-400,只用上了46組,還有預留有2組空缺的,46×64=2944個,規(guī)模要比RTX 2080 Ti小多了,真怨不得RTX 2080 Ti為什么貴那么多。
TU104
頻率方面,RTX 20系列顯卡頻率還是相對保守,沒有說一來就上2GHz這種可怕設定。但這一次頻率高低出現了微妙的變化,以往Founders Edition版本意味著是最低的基礎頻率,然而在RTX 20系列中,它也預超頻了。RTX 2080 Ti Founders Edition設定在1350MHz,起步看似很低,但boost頻率可達1635MHz,將近300MHz的boost范圍前所未有,Pascal架構顯卡的基本上都是150MHz以內。RTX 2080 Founders Edition是在1515-1800MHz之間。另外有NVIDIA GPU BOOST 4.0神秘加成,頻率還能更上一層樓!不過我們也擔心,Founders Edition版本預設頻率較高,GPU BOOST 4.0兇殘,12nm FFN非大改工藝,留給玩家的超頻空間依然有限。
浮點性能上,因為涉及到CUDA單元、Tensor Core、RT Core,三者性能差異各不相同,個中關系也很微妙。就單精度性能而言,RTX 2080居然和GTX 1080 Ti不分伯仲,所以大家就不要說期待RTX 2080吊打GTX 1080 Ti了,不過RTX 2080 Ti是真的強,14.2TLFOPS要比GTX 1080 Ti的10.6TLFPOS高多;由于Pascal架構顯卡沒有Tensor Core,Tensor INT4這方面算力為0,RTX 2080 Ti、RTX 2080分別為455.4、339.1TOPS;衡量光線追蹤能力的RTX- OPS上,圖靈顯卡由于有專屬的加速硬件RT Core,RTX 2080 Ti、RTX 2080可以做到78、60 TOPS,而GTX 1080 Ti、GTX 1080只有可憐的11.3、8.9 TOPS。
顯存方面,顯示器分辨率不斷提高、紋理貼圖尺寸更大、渲染技術也越來越復雜、數據交互量非常大、顯存帶來以及容量大小在影響GPU性能中占比越來越大,為了解決這些瓶頸,NVIDIA首次采用了GDDR6顯存。GDDR6繼承了GDDR5X中的16bit預取寬度,使用了改進版的QDR 4倍數據倍率技術,GDD6顯存速度因此可以拋開GDDR5一大截,而NVIDIA本次在Turing顯卡上全部采用14Gbps版本。GDDR6好處顯然易見,那就是顯存帶寬的直線上升,就是為了滿足實時光線追蹤大量數據交換。舉個例子,GTX 1080 Ti 11GB 11Gbps的GDDR5X顯存帶寬才484GB/s,RTX 2070 8GB 14Gbps的GDDR6顯存帶寬就有484GB/s,RTX 2080 Ti就更厲害了,帶寬都虐了HBM 2,難怪NVIDIA不愿意用HBM 2顯存,GDDR6優(yōu)勢明顯了。
功耗方面,從Maxwell、Pascal架構開始,NVIDIA開始對顯卡功耗進行大刀闊斧地進行改革,一直在給功耗做減法。但Turing架構就沒辦法了,因為Tensor Core、RT Core的加入,引入了大量額外的晶體管,功耗只能漲了,RTX 2080 Ti Founders Edition是260W,略高于GTX 1080 Ti的250W,需要8+8Pin外接供電;RTX 2080就漲得更多了,需要250W,而上一代同級GTX 1080只要180W,因此供電接口也改為了6+8 Pin。
顯示接口方面,I/O接口一直都在不斷小型化,臃腫的接口都會面臨淘汰的一天,VGA是這樣,這一次輪到DVI了,僅保留一個HDMI 2.0b、三個DisplayPort 1.4接口,以及一個新上位的USB Type-C視頻輸出接口。USB Type-C只是接口形式,內部其實還是走DisplayPort 1.4協(xié)議,最高支持8K分辨率。它不僅僅充當視頻輸出接口,還能傳輸數據、充電!那就是之前由微軟、英偉達、AMD、Oculus、Valve牽頭制定的VirtualLink,可以走DisplayPort HBR3協(xié)議、USB 3.1 Gen2 (10Gbps)、最高27W供電。能夠簡化虛擬現實設備的調校準備,比方說HTC Vive本身就需要HDMI、USB 3.0、電源多種線纜,現在一根USB Type -C就搞定了。
價格方面,NVIDIA一直在鼓吹的消費升級,在RTX 20系列顯卡中得到了具體體現,RTX 2080 Ti售價已經高達8199元(Founders Edition 9999元),GTX 1080 Ti當初售價不過是5699元,漲幅43%,真的是可怕。RTX 2080也漲到5699元起步,而GTX 1080發(fā)售之初只要4599元??梢灶A期,萬元顯卡已經成為了新常態(tài)。