1995年公布的名為Cheops中的流處理器,是針對(duì)某一個(gè)特定的視頻處理功能而設(shè)計(jì)的一種不可編程的流處理器。但為了得到一定的靈活性,系統(tǒng)中也包含一個(gè)通用的可編程處理器。從1996年到2001年,MIT和Standford針對(duì)圖像處理的應(yīng)用,,研制了名為Imagine 的可編程流處理器。Imagine流處理器沒(méi)有采用cache,而是采用一個(gè)流寄存器文件SRF(Stream Register File),作為流(主)存儲(chǔ)器與處理器寄存器之間的緩沖存儲(chǔ)器,來(lái)解決存儲(chǔ)器帶寬問(wèn)題的。流存儲(chǔ)器與SRF之間的帶寬是2GB/s,SRF與處理器寄存器之間的帶寬是32GB/s,ALU簇(ALU Cluster)內(nèi)寄存器與ALU之間的帶寬是544GB/s,三種帶寬的比例關(guān)系為1:16:272。抗鋸齒是3D特效中最重要的效果之一,它經(jīng)過(guò)多年的發(fā)展,變?yōu)橐粋€(gè)龐大的家庭,有必要獨(dú)立開(kāi)來(lái)說(shuō)明一下。
每個(gè)流處理器當(dāng)中都有專門高速單元負(fù)責(zé)解碼和執(zhí)行流數(shù)據(jù)。片載緩存是一個(gè)典型的采用流處理器的單元,它可以迅速輸入和讀取數(shù)據(jù)從而完成下一步的渲染。流處理器多少對(duì)顯卡性能有決定性作用,可以說(shuō)高中低端的顯卡除了核心不同外最主要的差別就在于流處理器數(shù)量,但是有一點(diǎn)要注意,就是NV和AMD的顯卡流處理器數(shù)量不具有可比性,他們兩家的顯卡核心架構(gòu)不同,不能通過(guò)比較流處理器多少來(lái)看性能,一般情況下NV的顯卡流處理器數(shù)量會(huì)明顯少于AMD,要從流處理器多少來(lái)看性能,只能自家的與自家的比,比如3850與3450相比,8600與8800相比 。當(dāng)然,就像你的CPU主頻高低一樣的道理.一般顯卡流處理的多少都會(huì)影響視頻與高清視頻的解碼功能,不過(guò)最主要的還是你的顯卡核心.現(xiàn)在最好的核心應(yīng)該是G106的.不過(guò),光這些還不夠,你的顯卡架構(gòu)也決定性能.就像專業(yè)顯卡和游戲顯卡的區(qū)別一樣,即使東西都完全一樣但不是一個(gè)概念.8800GTS還不如一張普通的G92核心的專業(yè)顯卡性能強(qiáng)悍.一般來(lái)說(shuō),流處理器數(shù)量越多,顯卡性能越強(qiáng)勁,比如擁有640個(gè)流處理器的顯卡要比擁有80個(gè)流處理器的顯卡高出幾個(gè)檔次。
我們?cè)谡鎸?shí)世界看到的物體,由微觀粒子組成,由于人的肉眼極限分辨不出分子原子級(jí)別的排布,就不會(huì)有鋸齒現(xiàn)象,而顯示器沒(méi)有足夠多的像素點(diǎn)來(lái)表現(xiàn)圖形,點(diǎn)與點(diǎn)之間的不連續(xù)就造成了鋸齒。抗鋸齒通過(guò)采樣算法,在像素與像素之間進(jìn)行平均值計(jì)算,增加像素的數(shù)目,達(dá)到像素之間平滑過(guò)渡的效果。去掉鋸齒后,還可以模擬高分辨率游戲的精致畫面。它是目前最熱門的特效,主要用于1600 * 1200以下的低分辨率。理論上來(lái)說(shuō),在17寸顯示器上,1600 * 1200分辨率已經(jīng)很難看到鋸齒,無(wú)須使用抗鋸齒算法。如此類推,在19寸顯示器上,必須使用1920 x 1080分辨率,總之,越大的顯示器,分辨率越高,才越不會(huì)看到鋸齒。由于RAMDAC(Random Access Memory Digital to Analog Converter,隨機(jī)存儲(chǔ)器數(shù)/模轉(zhuǎn)換器)頻率和顯示器制造技術(shù)的限制,我們不可能永無(wú)止境地提升顯示器和顯卡的分辨率,抗鋸齒技術(shù)變得很有必要了。超級(jí)采樣抗鋸齒最早期的全屏抗鋸齒,方法簡(jiǎn)單直接。首先,圖像創(chuàng)建到一個(gè)分離的緩沖區(qū),緩沖區(qū)圖像分辨率高于屏幕分辨率,假設(shè)是2*1(或2x),那么緩沖區(qū)場(chǎng)景的水平尺寸比屏幕分辨率高兩倍,若是2*2(或4x)抗鋸齒,緩沖區(qū)圖像的水平和垂直均比顯示圖像大兩倍。像素計(jì)算加倍之后,選取2個(gè)或4個(gè)鄰近像素,此過(guò)程稱為采樣。把這些采樣混合起來(lái)后,生成的最終像素,擁有鄰近像素的特征,那么像素與像素之間的過(guò)渡色彩,就變得更為近似,整個(gè)圖像的色彩過(guò)渡趨于平滑。再把最終像素輸出到幀緩沖,作為一幅圖像存儲(chǔ)起來(lái),然后發(fā)到顯示器,顯示出一幀畫面。每幀都進(jìn)行抗鋸齒處理,游戲過(guò)程中的所有畫面都變得帶有抗鋸齒效果了。游戲卡曼奇四中采用的4X抗鋸齒算法,Commanche 4 4xs邊緣超級(jí)采樣抗鋸齒超級(jí)采樣效果很好,但效率極低,嚴(yán)重影響顯卡性能。新的4x抗鋸齒方法,只把抗鋸齒應(yīng)用于物體邊緣,避免占用過(guò)大的緩沖區(qū)。工作過(guò)程比超級(jí)采樣稍為復(fù)雜,幾何引擎生成多邊形后,光柵單元會(huì)進(jìn)行描色工作,同時(shí)檢查當(dāng)前的紋理,看看它是否需要用2x2采樣的方式填充到多邊形邊緣。如果不是,GPU只計(jì)算一種色彩,在中間插入紋理像素,然后用單色填充這個(gè)塊。這些就是非邊緣像素,無(wú)須進(jìn)行抗鋸齒處理。