Intel很認真:Haswell GPU有點融合的意思
Intel GPU集成顯卡一貫都是孱弱的代名詞,不過這幾年的HD Graphics系列每一代都能看到巨大的進步,盡管無法和AMD APU相提并論但的確能看到踏踏實實的進步,尤其是在CPU連年進展緩慢的情況下,更顯得難能可貴。
GDC 2013大會上,Intel就宣布Haswell GPU將會增加支持兩個新的DirectX API擴展。第一個是“PixelSync”(像素同步),其實“順序無關(guān)透明”(Order Independent Transparency/OIT)技術(shù)的Intel版本,還是軟硬件結(jié)合的。
OIT技術(shù)意在快速整理渲染對象的透明度,使之以正確的順序進行渲染,能帶來不錯的效果,并節(jié)省GPU資源。
盡管該技術(shù)通常都和DX11聯(lián)系在一起,但并非DX11的一部分,只是通過DX11 API來實現(xiàn)而已。Intel宣稱,現(xiàn)有的OIT技術(shù)對顯存和顯存帶寬的需求是無止境的,隨著著色器復雜度的提高會急劇增加,Haswell和其它整合圖 形核心恰恰又在這方面力不從心,因此需要在帶寬效率上改進才行。
PixelSync在硬件方面就是簡單地在Haswell GPU上開啟可編程混合操作。Intel在其中放置了新的硬件單元,可以通過PixelSync擴展強制鎖定顯存訪問的序列,對于特定代碼,讓任何運行在相同像素上的著色器串行執(zhí)行,而不是并行執(zhí)行。這種限制僅僅用于重疊像素,所以對其它部分的代碼不會影響性能。
軟件方面是Intel自己的一套算法,通過高質(zhì)量壓縮來降低顯存占用,從而提供可以接受的性能。對此感興趣的可以參看這份文檔。
Intel宣稱已經(jīng)有兩名頂級開發(fā)者將會支持PixelSync,其一是Codemasters游戲制作人、負責過《超級房車賽2》的Clive Moody,他對此非常興奮,其二是英國游戲開發(fā)商Creative Assembly,《全面戰(zhàn)爭:羅馬2》里就會用到此技術(shù)。
第二個擴展是“InstantAccess”(即時訪問),也就是Intel版本的“零拷貝”(Zero Copy),有點融合統(tǒng)一尋址的意思。AMD Llano APU里就已經(jīng)有了這個東西。
Intel集成顯卡一直在共享系統(tǒng)內(nèi)存,但是CPU、GPU各自獨立,并不能直接訪問對方的尋址空間,所以GPU如果需要用到CPU內(nèi)存里的什么東 西,就必須首先建立一份自己的拷貝,這個過程很消耗時間、拖慢性能。隨著異構(gòu)計算的興起,CPU、GPU同時利用內(nèi)存里的相同數(shù)據(jù)已經(jīng)是大勢所趨。
有了InstantAccess,Intel顯卡驅(qū)動就能提供一個關(guān)于GPU顯存位置的指針,CPU可以直接訪問它。CPU無需拷貝就能使用GPU地址,用完之后再還回去。