顯卡工作原理
首先我們應(yīng)該了解一下顯卡的簡(jiǎn)單工作原理:首先,由CPU送來(lái)的數(shù)據(jù)會(huì)通過(guò)AGP或PCI-E總線,進(jìn)入顯卡的圖形芯片(即我們常說(shuō)的GPU或VPU)里進(jìn)行處理。當(dāng)芯片處理完后,相關(guān)數(shù)據(jù)會(huì)被運(yùn)送到顯存里暫時(shí)儲(chǔ)存。然后數(shù)字圖像數(shù)據(jù)會(huì)被送入RA罵死我吧AC(Random Access Memory Digital Analog Converter),即隨機(jī)存儲(chǔ)數(shù)字模擬轉(zhuǎn)換器,轉(zhuǎn)換成計(jì)算機(jī)顯示需要的模擬數(shù)據(jù)。最后RA罵死我吧AC再將轉(zhuǎn)換完的類比數(shù)據(jù)送到顯示器成為我們所看到的圖像。在該過(guò)程中,圖形芯片對(duì)數(shù)據(jù)處理的快慢以及顯存的數(shù)據(jù)傳輸帶寬都會(huì)對(duì)顯卡性能有明顯影響。
技術(shù)參數(shù)和架構(gòu)解析
一、核心架構(gòu):
我們經(jīng)常會(huì)在顯卡文章中看到“8×1架構(gòu)”、“4×2架構(gòu)”這樣的字樣,它們代表了什么意思呢?“8×1架構(gòu)”代表顯卡的圖形核心具有8條像素渲染管線,每條管線具有1個(gè)紋理貼圖單元;而“4×2架構(gòu)”則是指顯卡圖形核心具有4條像素渲染管線,每條管線具有2個(gè)紋理貼圖單元。也就是說(shuō)在一個(gè)時(shí)鐘周期內(nèi),8×1架構(gòu)可以完成8個(gè)像素渲染和8個(gè)紋理貼圖;而4×2架構(gòu)可以完成4個(gè)像素渲染和8個(gè)紋理貼圖。從實(shí)際游戲效果來(lái)看,這兩者在相同工作頻率下性能非常相近,所以常被放在一起討論。
舉例來(lái)說(shuō),nVIDIA在發(fā)布GeForce FX 5800 Ultra的時(shí)候,對(duì)于其體系架構(gòu)就沒(méi)有給出詳盡說(shuō)明。后來(lái)人們發(fā)現(xiàn)官方文檔中提到的每個(gè)周期處理8個(gè)像素的說(shuō)法,只是指的Z/stencil像素,其核心架構(gòu)可以看作是GeForce4 Ti系列4×2架構(gòu)的改進(jìn)版本,其后發(fā)布的GeForce FX 5900系列也是如此。ATi的Radeon 9700和9800系列則具有完整的8條像素渲染管線。但是這些顯卡的性能基本上都處于一個(gè)檔次。
目前主流的中低端顯卡,基本上都是4×1架構(gòu)或2×2架構(gòu),也就是單位周期只能完成4個(gè)紋理貼圖。而更高端的產(chǎn)品則擁有12×1架構(gòu)甚至16×1架構(gòu)。
二、核心工作頻率:
俗話說(shuō)得好:“勤能補(bǔ)拙”。雖然高規(guī)格的架構(gòu)擁有先天性的優(yōu)勢(shì),但是中低規(guī)格的核心架構(gòu)通過(guò)提高工作頻率,也可以達(dá)到接近中高端產(chǎn)品的性能。
舉例來(lái)說(shuō),Radeon 9500PRO采用的是8×1架構(gòu),而Radeon 9600XT則只是4×1架構(gòu)。不過(guò)采用0.15微米制造工藝的Radeon 9500PRO核心/顯存工作頻率是275MHz/540MHz,而采用0.13微米工藝的Radeon 9600XT則達(dá)到了500MHz/600MHz,核心頻率幾乎是前者的兩倍。因此在單位時(shí)間內(nèi),它們可完成的像素渲染和紋理貼圖工作量大致相當(dāng),因此性能處于同一水平。所以采用更先進(jìn)制造工藝,擁有良好超頻性能的顯卡產(chǎn)品往往很受玩家歡迎。
三、顯存帶寬:
在大型3D游戲等應(yīng)用中,顯卡的圖形芯片與顯存之間經(jīng)常需要進(jìn)行大量的數(shù)據(jù)交換。這時(shí)如果顯存的數(shù)據(jù)傳輸帶寬太低,就會(huì)嚴(yán)重制約數(shù)據(jù)的順利傳輸,導(dǎo)致圖形芯片時(shí)常處于“等米下鍋”的狀態(tài),這也是對(duì)芯片性能的浪費(fèi)。所以DIY玩家在超頻顯卡時(shí),往往是將核心/顯存頻率一起提升,這樣就不容易讓顯存帶寬成為制約顯卡性能的瓶頸。64bit顯存位寬的顯卡之所以被玩家們所“鄙視”,也正是因?yàn)槠?strong>顯存的數(shù)據(jù)傳輸帶寬大幅縮水。
除了前面提到的內(nèi)容外,圖形芯片的處理效率以及驅(qū)動(dòng)程序的優(yōu)劣也都是影響顯卡性能的重要因素。
解讀顯卡性能
通過(guò)上面的介紹,我們應(yīng)該不難從顯卡的技術(shù)參數(shù)中了解其實(shí)際性能。例如在真實(shí)游戲測(cè)試中,4×2構(gòu)架的GeForce4 Ti 4200速度居然屢屢勝出采用4×1構(gòu)架的GeForce FX 5600、5700以及Radeon 9600、9600PRO等中高端顯卡。只有GeForce FX 5700Ultra和Radeon 9600XT才略為挽回一點(diǎn)面子,不過(guò)它們的核心工作頻率比起GeForce4 Ti 4200幾乎翻了一番,售價(jià)也幾乎高出后者一倍。要不是無(wú)法支持DirectX 9特效限制了GeForce4 Ti 4200的施展空間,當(dāng)今市場(chǎng)上的諸多中端顯卡都將面臨非常難堪的境地,也難怪4200能成為一代經(jīng)典。而如果選擇4×1/2×2構(gòu)架的顯卡產(chǎn)品,我們也可以通過(guò)超頻使其達(dá)到更好的性能。