GPU簡(jiǎn)介及相關(guān)問(wèn)題
圖形處理器(英語(yǔ):graphics processing unit,縮寫(xiě):GPU),又稱(chēng)顯示核心、視覺(jué)處理器、顯示芯片,是一種專(zhuān)門(mén)在個(gè)人電腦、工作站、游戲機(jī)和一些移動(dòng)設(shè)備(如平板電腦、智能手機(jī)等)上做圖像和圖形相關(guān)運(yùn)算工作的微處理器。
GPU使顯卡減少了對(duì)CPU的依賴(lài),并進(jìn)行部分原本CPU的工作,尤其是在3D圖形處理時(shí)GPU所采用的核心技術(shù)有硬件T&L(幾何轉(zhuǎn)換和光照處理)、立方環(huán)境材質(zhì)貼圖和頂點(diǎn)混合、紋理壓縮和凹凸映射貼圖、雙重紋理四像素256位渲染引擎等,而硬件T&L技術(shù)可以說(shuō)是GPU的標(biāo)志。GPU的生產(chǎn)商主要有NVIDIA和ATI。
一個(gè)光柵顯示系統(tǒng)離不開(kāi)圖形處理器,圖形處理器是圖形系統(tǒng)結(jié)構(gòu)的重要元件,是連接計(jì)算機(jī)和顯示終端的紐帶。應(yīng)該說(shuō)有顯示系統(tǒng)就有圖形處理器(俗稱(chēng)顯卡),但是早期的顯卡只包含簡(jiǎn)單的存儲(chǔ)器和幀緩沖區(qū),它們實(shí)際上只起了一個(gè)圖形的存儲(chǔ)和傳遞作用,一切操作都必須由CPU來(lái)控制。這對(duì)于文本和一些簡(jiǎn)單的圖形來(lái)說(shuō)是足夠的,但是當(dāng)要處理復(fù)雜場(chǎng)景特別是一些真實(shí)感的三維場(chǎng)景,單靠這種系統(tǒng)是無(wú)法完成任務(wù)的。所以后來(lái)發(fā)展的顯卡都有圖形處理的功能。它不單單存儲(chǔ)圖形,而且能完成大部分圖形功能,這樣就大大減輕了CPU的負(fù)擔(dān),提高了顯示能力和顯示速度。隨著電子技術(shù)的發(fā)展,顯卡技術(shù)含量越來(lái)越高,功能越來(lái)越強(qiáng),許多專(zhuān)業(yè)的圖形卡已經(jīng)具有很強(qiáng)的3D處理能力,而且這些3D圖形卡也漸漸地走向個(gè)人計(jì)算機(jī)。一些專(zhuān)業(yè)顯卡具有的晶體管數(shù)甚至比同時(shí)代的CPU的晶體管數(shù)還多。比如2000年加拿大ATI公司推出的 RADEON顯卡芯片含有3千萬(wàn)顆晶體管,達(dá)到每秒15億個(gè)象素填寫(xiě)率。
計(jì)算能力和計(jì)算模式方面的問(wèn)題當(dāng)前 GPU 的基礎(chǔ) ———傳統(tǒng) Z-buffer 算法不能滿(mǎn)足新的應(yīng)用需求。在實(shí)時(shí)圖形和視頻應(yīng)用中 ,需要更強(qiáng)大的通用計(jì)算能力 ,比如支持碰撞檢測(cè)、近似物理模擬;在游戲中需要圖形處理算法與人工智能和場(chǎng)景管理等非圖形算法相結(jié)合。當(dāng)前的GPU 的體系結(jié)構(gòu)不能很好地解決電影級(jí)圖像質(zhì)量需要解決的透明性、高質(zhì)量反走樣、運(yùn)動(dòng)模糊、景深和微多邊形染色等問(wèn)題 ,不能很好的支持實(shí)時(shí)光線跟蹤、Reyes(Renders everything you ever saw) 等更加復(fù)雜的圖形算法 ,也難以應(yīng)對(duì)高質(zhì)量的實(shí)時(shí)3D圖形需要的全局光照、動(dòng)態(tài)和實(shí)時(shí)顯示以及陰影和反射等問(wèn)題。需要研究新一代的 GPU 體系結(jié)構(gòu)突破這些限制。隨著 VLSI 技術(shù)的飛速發(fā)展 ,新一代 GPU芯片應(yīng)當(dāng)具有更強(qiáng)大的計(jì)算能力 ,可以大幅度提高圖形分辨率、場(chǎng)景細(xì)節(jié) (更多的三角形和紋理細(xì)節(jié))和全局近似度。圖形處理系統(tǒng)發(fā)展的趨勢(shì)是圖形和非圖形算法的融合以及現(xiàn)有的不同染色算法的融合。新一代的圖形系統(tǒng)芯片需要統(tǒng)一靈活的數(shù)據(jù)結(jié)構(gòu)、新的程序設(shè)計(jì)模型、多種并行計(jì)算模式。我們認(rèn)為發(fā)展的趨勢(shì)是在統(tǒng)一的、規(guī)則并行處理元陣列結(jié)構(gòu)上 ,用數(shù)據(jù)級(jí)并行、操作級(jí)并行和任務(wù)級(jí)并行的統(tǒng)一計(jì)算模式來(lái)解決當(dāng)前圖形處理系統(tǒng)芯片面臨的問(wèn)題。
集成電路發(fā)展到納米級(jí)工藝 ,不斷逼近物理極限 ,出現(xiàn)了所謂紅墻問(wèn)題:一是線的延遲比門(mén)的延遲越來(lái)越重要。長(zhǎng)線不僅有傳輸延遲問(wèn)題 , 而且還有能耗問(wèn)題。二是特征尺寸已小到使芯片制造缺陷不可避免 ,要從缺陷容忍、故障容忍與差錯(cuò)容忍等三個(gè)方面研究容錯(cuò)與避錯(cuò)技術(shù)。三是漏電流和功耗變得非常重要 ,要采用功耗的自主管理技術(shù)?,F(xiàn)代的圖形處理器芯片在克服紅墻問(wèn)題的幾個(gè)方面有了顯著的進(jìn)步:利用了大量的規(guī)則的 SIMD 陣列結(jié)構(gòu);它的分布存儲(chǔ)器接近了運(yùn)算單元 ,減少了長(zhǎng)線影響;它的硬件多線程掩蓋了部分存儲(chǔ)延遲的影響。但是隨著工藝進(jìn)一步發(fā)展 ,當(dāng)前 GPU 的體系結(jié)構(gòu)難以適應(yīng)未來(lái)工藝發(fā)展 ,沒(méi)有在體系結(jié)構(gòu)上應(yīng)對(duì)長(zhǎng)線問(wèn)題、工藝偏差和工藝缺陷問(wèn)題的措施 ,特別是沒(méi)有考慮如何適應(yīng)三維工藝。當(dāng)前最先進(jìn)工藝的晶體管的柵極厚度已經(jīng)大約是五個(gè)原子,在制造時(shí),少了一個(gè)原子就造成20 %的工藝偏差。因此工藝的偏差成為SoC設(shè)計(jì)不能不考慮的問(wèn)題。特別是到 2018 年后的納電子集成電路 ,可以通過(guò)隨機(jī)自組裝產(chǎn)生規(guī)則的納米器件。因此,新一代系統(tǒng)芯片的體系結(jié)構(gòu)必須利用規(guī)則的結(jié)構(gòu)并且容忍工藝偏差 ,具有容錯(cuò)、避錯(cuò)和重組的能力。我們認(rèn)為采用大量同構(gòu)處理器元之間的鄰接技術(shù) ,適應(yīng)納米級(jí)工藝和未來(lái)的三維工藝 ,采用新型體系結(jié)構(gòu)和相關(guān)的低功耗、容錯(cuò)和避錯(cuò)的設(shè)計(jì)策略 ,對(duì)于未來(lái)的圖形處理系統(tǒng)芯片具有重要的科學(xué)意義。