計(jì)算機(jī)圖形學(xué)年鑒：研究現(xiàn)狀、應(yīng)用和未來(lái)

時(shí)間：2020-06-15 13:21:01

關(guān)鍵字：圖形處理器虛擬現(xiàn)實(shí)

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 計(jì)算機(jī)圖形學(xué)是支持各種影視特效、三維動(dòng)畫(huà)影片、計(jì)算機(jī)游戲、虛擬現(xiàn)實(shí)以及大家手機(jī)上各種照片視頻美化特效背后的技術(shù)基礎(chǔ)，在本文中，微軟亞洲研究院網(wǎng)絡(luò)圖形組深入解釋了圖形學(xué)的現(xiàn)狀、發(fā)展和未來(lái)。

計(jì)算機(jī)圖形學(xué)是支持各種影視特效、三維動(dòng)畫(huà)影片、計(jì)算機(jī)游戲、虛擬現(xiàn)實(shí)以及大家手機(jī)上各種照片視頻美化特效背后的技術(shù)基礎(chǔ)，在本文中，微軟亞洲研究院網(wǎng)絡(luò)圖形組深入解釋了圖形學(xué)的現(xiàn)狀、發(fā)展和未來(lái)。

談及“計(jì)算機(jī)圖形學(xué)”，可能很多人會(huì)覺(jué)得很有距離感，或者和計(jì)算機(jī)視覺(jué)、圖像處理等學(xué)科混淆。但是，如果告訴大家圖形學(xué)技術(shù)是支持各種影視特效、三維動(dòng)畫(huà)影片、計(jì)算機(jī)游戲、虛擬現(xiàn)實(shí)以及大家手機(jī)上各種照片視頻美化特效背后的技術(shù)基礎(chǔ)，相信大家都不會(huì)再覺(jué)得陌生。

在計(jì)算機(jī)誕生后，如何在計(jì)算機(jī)中有效地表達(dá)、處理以及顯示三維信息，很快變成了計(jì)算機(jī)應(yīng)用研究中的一個(gè)重要問(wèn)題。針對(duì)這一需求，計(jì)算機(jī)圖形學(xué)在二十世紀(jì)六十年代應(yīng)運(yùn)而生。在過(guò)去的幾十年中，計(jì)算機(jī)圖形學(xué)得到了長(zhǎng)足的發(fā)展，并深深地影響了很多產(chǎn)業(yè)的發(fā)展和人們的生活、工作和娛樂(lè)方式。

在硬件上，圖形學(xué)的發(fā)展催生了專用圖形處理器GPU(graphics processing unit)的產(chǎn)生與普及。在軟件上，圖形學(xué)的基本繪制流水線已成為操作系統(tǒng)的一部分，為各種計(jì)算機(jī)平臺(tái)提供顯示和圖形處理。應(yīng)用上，圖形學(xué)催生了影視特效、三維動(dòng)畫(huà)影片、數(shù)據(jù)可視化、計(jì)算機(jī)游戲、虛擬現(xiàn)實(shí)、計(jì)算機(jī)輔助設(shè)計(jì)和制造等一系列產(chǎn)業(yè)，并為這些產(chǎn)業(yè)的發(fā)展提供了核心技術(shù)和算法支持。

作為一個(gè)計(jì)算機(jī)應(yīng)用學(xué)科，計(jì)算機(jī)圖形學(xué)的內(nèi)涵和外延在過(guò)去幾十年里也在不斷地演進(jìn)和擴(kuò)展。如果我們回顧計(jì)算機(jī)圖形學(xué)年會(huì)ACMSIGGRAPH上過(guò)去十幾年發(fā)表的論文，一方面會(huì)驚嘆其中紛雜精彩的研究題目和每篇文章作者的奇思妙想，另一方面也難免感到有些迷失，似乎圖形學(xué)僅僅是在不斷追求新奇和炫目的視覺(jué)效果。這是在一個(gè)快速發(fā)展的應(yīng)用學(xué)科中很多剛?cè)腴T的學(xué)者都會(huì)有的困惑。

圖形學(xué)研究的核心是什么？推動(dòng)圖形學(xué)發(fā)展的動(dòng)力是什么？未來(lái)，隨著計(jì)算機(jī)圖形學(xué)的進(jìn)一步發(fā)展，哪些應(yīng)用場(chǎng)景將呼之欲出？伴隨著這些新的應(yīng)用場(chǎng)景、需求的出現(xiàn)，我們面臨的技術(shù)挑戰(zhàn)又是怎樣的？在這篇文章中，我們?cè)囍鴮?duì)圖形學(xué)的現(xiàn)狀、發(fā)展和未來(lái)做一些思考，并嘗試一一回答這些問(wèn)題。

計(jì)算機(jī)圖形學(xué)研究與應(yīng)用現(xiàn)狀

圖形學(xué)的核心科學(xué)問(wèn)題是在計(jì)算機(jī)中有效的表達(dá)和處理三維世界的各種屬性。圖形學(xué)所處理的三維信息既包括物理真實(shí)世界中的三維信息，也包含我們?nèi)祟惔竽X通過(guò)想象產(chǎn)生的虛擬的三維信息。計(jì)算機(jī)圖形作為一個(gè)中介，提供了這兩個(gè)世界在計(jì)算機(jī)中的一個(gè)共同的表達(dá)和信息交流渠道。

在計(jì)算機(jī)圖形學(xué)誕生之前，物理學(xué)家和數(shù)學(xué)家已經(jīng)對(duì)真實(shí)三維世界進(jìn)行了長(zhǎng)期的研究，把我們觀察到的世界有效的解構(gòu)為核心的一些物理量和他們之間相互作用的規(guī)律。如圖1所示，傳統(tǒng)的圖形學(xué)受物理學(xué)和數(shù)學(xué)啟發(fā)，將三維對(duì)象分解為幾何、表觀、行為或者動(dòng)態(tài)三種屬性。其中幾何描述三維對(duì)象的幾何形狀；表觀描述三維對(duì)象的材料光照屬性以及材料如何和光相互作用；行為則表達(dá)了一個(gè)三維對(duì)象的動(dòng)態(tài)特性從而決定了對(duì)象的運(yùn)動(dòng)和其他物體的交互行為。

在這個(gè)基礎(chǔ)上，針對(duì)不同對(duì)象特性和應(yīng)用要求的不同，圖形學(xué)研究中具體的三維對(duì)象又可以大致分為物體、人（包括類人的角色character）以及環(huán)境三部分。

針對(duì)這些三維對(duì)象的不同三維信息（幾何、表觀、行為），我們把圖形學(xué)的研究方向和技術(shù)也可以大致分為三個(gè)大類：

一是獲取和建模。主要研究如何有效地構(gòu)建、編輯、處理不同的三維信息在計(jì)算機(jī)中的表達(dá)，以及如何從真實(shí)世界中有效地獲取相應(yīng)的三維信息。這既包括三維幾何建模和幾何處理這一研究方向，也包含材質(zhì)和光照建模、人體建模、動(dòng)作捕捉這些研究課題。

二是理解和認(rèn)知。主要研究如何識(shí)別、分析并抽取三維信息中對(duì)應(yīng)的語(yǔ)義和結(jié)構(gòu)信息。這個(gè)方向有很多圖形學(xué)和計(jì)算機(jī)視覺(jué)共同感興趣的研究課題，如三維物體識(shí)別、檢索、場(chǎng)景識(shí)別、分割以及人體姿態(tài)識(shí)別跟蹤、人臉表情識(shí)別跟蹤等。

三是模擬和交互。主要研究如何處理和模擬不同三維對(duì)象之間的相互作用和交互過(guò)程。這既包含流體模擬和物理仿真，也包含繪制、人體動(dòng)畫(huà)、人臉動(dòng)畫(huà)等方面的研究。

在應(yīng)用層面，圖1中最外環(huán)黑色字展示了計(jì)算機(jī)圖形學(xué)的經(jīng)典應(yīng)用場(chǎng)景，圖形學(xué)的早期發(fā)展來(lái)源于使用計(jì)算機(jī)設(shè)計(jì)真實(shí)世界產(chǎn)品的需求，如汽車外形。因此，計(jì)算機(jī)輔助設(shè)計(jì)和制造成為了計(jì)算機(jī)圖形學(xué)在真實(shí)世界的核心應(yīng)用場(chǎng)景。隨著圖形學(xué)的發(fā)展，創(chuàng)建虛擬場(chǎng)景實(shí)現(xiàn)人類的想象，成為了圖形學(xué)在虛擬世界的核心應(yīng)用場(chǎng)景，產(chǎn)生了游戲、影視特效等應(yīng)用場(chǎng)景。隨著相機(jī)的普及，圖片和視頻的編輯也成為圖形學(xué)中一個(gè)重要的橫跨虛擬世界和真實(shí)世界的重要應(yīng)用。

有了上面的”洋蔥“結(jié)構(gòu)，我們就可以對(duì)每一個(gè)圖形學(xué)論文或者研究熱點(diǎn)，通過(guò)其研究對(duì)象、三維屬性和所屬技術(shù)對(duì)其進(jìn)行歸類，比如繪制（Rendering）算法的研究是對(duì)場(chǎng)景的表觀屬性進(jìn)行模擬和交互的研究：算法通過(guò)研究光與環(huán)境的交互作用，生成真實(shí)感的圖像。

對(duì)計(jì)算機(jī)圖形學(xué)發(fā)展模式的回顧和思考

回顧和思考過(guò)去幾十年來(lái)圖形學(xué)的發(fā)展，我們發(fā)現(xiàn)圖形學(xué)研究的核心對(duì)象和科學(xué)問(wèn)題并沒(méi)有發(fā)生根本性的變化。但是技術(shù)和三維信息的表達(dá)卻在不斷的發(fā)展更新。而這些技術(shù)的發(fā)展往往發(fā)端于新的硬件設(shè)備的出現(xiàn)和普及。

如圖2所示，新的硬件設(shè)備的出現(xiàn)一方面往往引發(fā)了新的應(yīng)用需求，或使得某個(gè)應(yīng)用的技術(shù)成本急劇的下降。另一方面帶來(lái)了新的數(shù)據(jù)和技術(shù)問(wèn)題，從而引發(fā)了新的研究方向和技術(shù)，推動(dòng)了對(duì)圖形對(duì)象表達(dá)的更新和研究方法的更新。而這些技術(shù)的發(fā)展又反過(guò)來(lái)進(jìn)一步推動(dòng)了硬件的發(fā)展和應(yīng)用的普及，從而帶動(dòng)整個(gè)領(lǐng)域的快速迭代發(fā)展。光柵化圖形顯示技術(shù)的出現(xiàn)，GPU圖形學(xué)流水線的提出，可編程GPU的出現(xiàn)，三維掃描儀的出現(xiàn)，圖像采集設(shè)備的出現(xiàn)和普及，是過(guò)去幾十年圖形學(xué)發(fā)展幾次浪潮的背后緣起。

這里我們以基于圖像的繪制和光場(chǎng)表達(dá)的出現(xiàn)為例對(duì)上述的發(fā)展模式做一個(gè)分析。傳統(tǒng)圖形學(xué)中，所有的研究對(duì)象和屬性基本是基于物理表達(dá)。在這一表達(dá)下，幾何和物理過(guò)程成為了各個(gè)研究方向的基礎(chǔ)。

從20世紀(jì)后期開(kāi)始，隨著圖像捕捉設(shè)備的快速發(fā)展，人們有機(jī)會(huì)對(duì)真實(shí)世界進(jìn)行大量的圖像采集。這些大量的圖像一方面需要研究者研發(fā)有效的圖像編輯，分析和解構(gòu)技術(shù)。另一方面，也使得研究者開(kāi)始探索是否可以拋開(kāi)背后的物理機(jī)制，直接基于三維世界的這些觀察建立新的表達(dá)。由此催生了基于全光函數(shù)的表達(dá)和基于圖像的繪制技術(shù)。

這里，全光函數(shù)是一個(gè)高維函數(shù)，記錄了在一個(gè)三維場(chǎng)景的任意一點(diǎn)（x,y,z）沿任給方向(θ,Φ)，在某一時(shí)間t,在每一波長(zhǎng)λ上的光強(qiáng)。在真實(shí)世界中，雖然每種我們可以觀察到的視覺(jué)現(xiàn)象都可以解構(gòu)為以上的三維基本屬性及其相互作用，但是我們的人眼和圖像傳感器可以觀測(cè)到的卻是光線，即全光函數(shù)（PlenopticFuncTIon）（x,y,z,θ,Φ,t,λ）的一個(gè)采樣。

圖像的表達(dá)和繪制技術(shù)的進(jìn)步，催生了計(jì)算攝像學(xué)的發(fā)展，反過(guò)來(lái)促進(jìn)了新的攝像設(shè)備的誕生和發(fā)展，并進(jìn)一步促進(jìn)了圖形學(xué)中對(duì)全光表達(dá)函數(shù)的采樣與重構(gòu)、分析與編輯、認(rèn)知與理解三個(gè)方向的研究。這一迭代發(fā)展過(guò)程，從根本上將三維信息的表達(dá)由基于物理的表達(dá)推廣到新的基于觀測(cè)的表達(dá),從而拓展了研究方法，并將圖形學(xué)的研究領(lǐng)域從傳統(tǒng)三維幾何擴(kuò)展到了圖像和視頻，并且和計(jì)算機(jī)視覺(jué)、圖像和視頻處理、光學(xué)成像等學(xué)科產(chǎn)生了新的交叉。

計(jì)算機(jī)圖形學(xué)的未來(lái)：設(shè)備和硬件

展望未來(lái)，我們認(rèn)為，上述圖形學(xué)發(fā)展的模式還會(huì)繼續(xù)。硬件的發(fā)展和革新，會(huì)不斷促進(jìn)了新的圖形技術(shù)和應(yīng)用產(chǎn)生和迭代發(fā)展。在這個(gè)過(guò)程中，圖形學(xué)也在不斷地結(jié)合計(jì)算機(jī)視覺(jué)、光學(xué)、信號(hào)處理與機(jī)器學(xué)習(xí)等學(xué)科的最新研究成果，來(lái)解決圖形學(xué)中的研究問(wèn)題。下面，我們就從各個(gè)層面對(duì)計(jì)算機(jī)圖形學(xué)的未來(lái)進(jìn)行一些大膽的展望。

在硬件設(shè)備方面，我們認(rèn)為下面的這些硬件會(huì)迎來(lái)新的發(fā)展并帶來(lái)圖形學(xué)技術(shù)和應(yīng)用的革命性進(jìn)展。

三維顯示。提供高分辨率，高動(dòng)態(tài)范圍的全三維顯示。包括近眼的光場(chǎng)顯示設(shè)備，或者多焦平面顯示設(shè)備?；蛘哌h(yuǎn)場(chǎng)的全沉浸式的光場(chǎng)顯示設(shè)備。

深度相機(jī)。提供和現(xiàn)有的彩色相機(jī)相匹配的高分辨率，高幀率，低功耗，低噪聲的深度相機(jī)。

多自由度機(jī)械手和類人軟體機(jī)器人裝置。提供低成本，高精度，編程可控的多自由度機(jī)械手以及具有類人外形的軟體機(jī)器人。

三維打印機(jī)。提供同時(shí)支持多種打印材料，高精度，低價(jià)格，快速的三維打印。

IOT與傳感器。提供小型、省電、低成本的能測(cè)量真實(shí)世界各種物理參數(shù)的傳感器與實(shí)時(shí)的數(shù)據(jù)收集。

力學(xué)捕捉與反饋設(shè)備。提供精確的，具有高空間分辨率和力分辨率的觸覺(jué)輸入輸出。

計(jì)算機(jī)圖形學(xué)的未來(lái)：應(yīng)用場(chǎng)景

隨著上述硬件設(shè)備的發(fā)展和普及，以及計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步，圖形學(xué)的應(yīng)用場(chǎng)景將得到更大的擴(kuò)展。如圖1黃色高亮部分所示，面向真實(shí)世界，機(jī)器人和三維打印將成為新的應(yīng)用場(chǎng)景。面向虛擬世界、虛擬現(xiàn)實(shí)，混合可視媒體將成為新興的應(yīng)用場(chǎng)景，帶給人們更好的娛樂(lè)體驗(yàn)，釋放人類的想象力。在真實(shí)世界和虛擬世界之間，增強(qiáng)現(xiàn)實(shí)將虛擬信息融合進(jìn)真實(shí)世界，并增強(qiáng)人類在真實(shí)世界的體驗(yàn)；數(shù)字化孿生則產(chǎn)生真實(shí)世界在虛擬世界的鏡像，方便我們更好地管理規(guī)劃真實(shí)世界。下面，我們將討論每個(gè)應(yīng)用場(chǎng)景，和它們對(duì)相關(guān)圖形學(xué)技術(shù)的需求。

機(jī)器人

隨著機(jī)械硬件，傳感器設(shè)備以及人工智能技術(shù)的進(jìn)步，多用途的機(jī)器人將逐漸被應(yīng)用到不同的真實(shí)世界場(chǎng)景中，自動(dòng)化或半自動(dòng)化地幫助人類完成各種任務(wù)。自動(dòng)駕駛可以被認(rèn)為是這一場(chǎng)景中一個(gè)應(yīng)用。機(jī)器人為了在不斷變化的三維場(chǎng)景中完成給定任務(wù)，不僅需要實(shí)時(shí)重建不斷變化的三維場(chǎng)景的幾何，還需要識(shí)別真實(shí)場(chǎng)景中的物體的類別和物理特性，從而預(yù)測(cè)物體的運(yùn)動(dòng)并決定自己的運(yùn)動(dòng)。同時(shí)，機(jī)器人自身也需要實(shí)時(shí)的動(dòng)態(tài)模擬技術(shù)來(lái)準(zhǔn)確地規(guī)劃和預(yù)測(cè)自己的運(yùn)動(dòng)，和環(huán)境中物體進(jìn)行交互，從而最終完成任務(wù)。

三維打印

三維打印硬件的發(fā)展使得生產(chǎn)復(fù)雜幾何形狀和不同幾何形狀的成本顯著下降。和傳統(tǒng)的減材制造不同，三維打印可以精確地控制三維形體中每個(gè)體素的材質(zhì)構(gòu)成，從而可以產(chǎn)生更為豐富的設(shè)計(jì)和功能。為了支持三維打印，圖形學(xué)技術(shù)需要將設(shè)計(jì)與物理模擬更好地結(jié)合在一起，提供一體化的端到端解決方案。通過(guò)高效的計(jì)算模擬和逆向優(yōu)化，幫助設(shè)計(jì)師和制造者快速地設(shè)計(jì)產(chǎn)品的三維形狀和內(nèi)部材質(zhì)分布，從而達(dá)到所需要的功能。

虛擬現(xiàn)實(shí)

虛擬現(xiàn)實(shí)技術(shù)作為一類新的媒體，提供了全新的沉浸式體驗(yàn)，在教育、游戲等方面具有重要的應(yīng)用。為了達(dá)到更好的虛擬現(xiàn)實(shí)體驗(yàn)，我們不僅需要圖形學(xué)渲染技術(shù)的進(jìn)步，也需要更好的物理模擬技術(shù)和交互技術(shù)，提供視覺(jué)外其他物理特性，如觸覺(jué)和聽(tīng)覺(jué)的建模和實(shí)時(shí)渲染。更為根本的是，如何更加快速地生成高質(zhì)量的三維虛擬內(nèi)容，以及如何在虛擬環(huán)境中和不同的虛擬內(nèi)容進(jìn)行有效的交互，是虛擬現(xiàn)實(shí)應(yīng)用得以成功和普及的關(guān)鍵。

增強(qiáng)現(xiàn)實(shí)

增強(qiáng)現(xiàn)實(shí)和混合現(xiàn)實(shí)系統(tǒng)通過(guò)將虛擬三維內(nèi)容疊加在真實(shí)場(chǎng)景中，從而實(shí)現(xiàn)了虛擬信息和真實(shí)世界的融合，提高了人們?cè)谡鎸?shí)世界的工作效率，提供了個(gè)性化的環(huán)境和更好的生活體驗(yàn)。某種程度上，可以將增強(qiáng)現(xiàn)實(shí)理解為新一代的精確GPS定位系統(tǒng)。它可以提供在場(chǎng)景中的實(shí)時(shí)精確三維定位和實(shí)時(shí)的三維地圖構(gòu)建服務(wù)。為了實(shí)現(xiàn)這一目標(biāo)，三維場(chǎng)景的實(shí)時(shí)捕捉建模（包括幾何、表觀、物理特性和行為），分析和理解將成為這一應(yīng)用場(chǎng)景背后的核心技術(shù)。

數(shù)字化孿生

和增強(qiáng)現(xiàn)實(shí)將虛擬信息疊加在真實(shí)世界相反，數(shù)字化孿生嘗試建立真實(shí)世界在計(jì)算機(jī)中的虛擬鏡像，并實(shí)時(shí)地記錄預(yù)測(cè)真實(shí)世界的所有變化。結(jié)合IoT和傳感器技術(shù)的發(fā)展，數(shù)字化孿生技術(shù)將提供真實(shí)環(huán)境的完整數(shù)字化，從而實(shí)現(xiàn)對(duì)真實(shí)世界的高效信息分析和控制。同時(shí)，數(shù)字化孿生為將為機(jī)器學(xué)習(xí)技術(shù)提供更多的數(shù)據(jù)和訓(xùn)練環(huán)境。為實(shí)現(xiàn)這一目標(biāo)，我們需要研究更加有效的三維建模和捕捉技術(shù)，以及實(shí)時(shí)的物理模擬技術(shù)。

計(jì)算機(jī)圖形學(xué)的未來(lái)：技術(shù)挑戰(zhàn)

上文中，我們看到了未來(lái)計(jì)算機(jī)圖形學(xué)的應(yīng)用場(chǎng)景，并討論了每個(gè)應(yīng)用場(chǎng)景所需要的關(guān)鍵技術(shù)。這些需求也為圖形學(xué)的發(fā)展提出了一系列的研究問(wèn)題與挑戰(zhàn)：

高效高質(zhì)量的三維內(nèi)容創(chuàng)作系統(tǒng)

雖然已有的圖形學(xué)算法和系統(tǒng)可以讓藝術(shù)家創(chuàng)作出具有高度真實(shí)感的虛擬環(huán)境和栩栩如生的人物及其動(dòng)態(tài)，這一過(guò)程仍然需要大量時(shí)間、專業(yè)技巧以及昂貴復(fù)雜的設(shè)備。發(fā)展高效高質(zhì)量的三維內(nèi)容生成算法和創(chuàng)作系統(tǒng)是圖形學(xué)研究中一個(gè)永恒的任務(wù)，也是虛擬現(xiàn)實(shí)、數(shù)字化孿生以及新一代的混合媒體等應(yīng)用場(chǎng)景得以實(shí)現(xiàn)的關(guān)鍵技術(shù)。

為了實(shí)現(xiàn)這個(gè)目標(biāo)，我們需要在以下三個(gè)方面的研究取得突破：一是研發(fā)新一代的捕捉硬件系統(tǒng)和算法，使得普通用戶越來(lái)越容易從真實(shí)世界中快速地捕捉所需要的三維內(nèi)容；二是利用三維內(nèi)容屬性的本征屬性，從用戶的少量輸入如草圖、照片、視頻中構(gòu)建符合用戶需求的三維內(nèi)容；三是利用機(jī)器學(xué)習(xí)技術(shù)，如對(duì)抗神經(jīng)網(wǎng)絡(luò)（GAN），直接從已有的大量數(shù)據(jù)中生成新的三維內(nèi)容。

三維世界的實(shí)時(shí)理解與分析

實(shí)時(shí)地對(duì)我們所處的三維世界進(jìn)行理解，識(shí)別出場(chǎng)景中物體和人，推斷物體和人之間的空間關(guān)系與約束，以及人的動(dòng)作，是增強(qiáng)現(xiàn)實(shí)和機(jī)器人應(yīng)用場(chǎng)景中的核心技術(shù)。

在計(jì)算機(jī)視覺(jué)領(lǐng)域，由于大量標(biāo)注數(shù)據(jù)的出現(xiàn)和深度學(xué)習(xí)技術(shù)的發(fā)展，圖像和視頻的理解與分析工作取得了飛速的發(fā)展。但是三維世界的理解和分析工作仍舊處于起始階段。

一方面，三維內(nèi)容由于獲取困難，可使用的標(biāo)注數(shù)據(jù)少，數(shù)據(jù)噪聲大。另一方面，三維數(shù)據(jù)表達(dá)多樣、維度更高。這些特點(diǎn)也對(duì)三維世界的分析理解算法的實(shí)時(shí)性、魯棒性提出了更大的挑戰(zhàn)。如何研發(fā)適合三維內(nèi)容的通用表達(dá)和機(jī)器學(xué)習(xí)算法，結(jié)合已有的圖片和視頻信息進(jìn)行三維世界的理解和分析也是這一領(lǐng)域未來(lái)研究的重點(diǎn)。

大規(guī)?？蓴U(kuò)展的實(shí)時(shí)模擬技術(shù)

在真實(shí)世界中，不同物體的運(yùn)動(dòng)和相互作用構(gòu)成了世界復(fù)雜的動(dòng)態(tài)。而在人類社會(huì)中，人的行為和交互則更為復(fù)雜。模擬這些復(fù)雜的動(dòng)態(tài)和交互是圖形學(xué)中一個(gè)重要任務(wù)，也是三維打印、機(jī)器人、數(shù)字化孿生應(yīng)用背后的重要技術(shù)支撐?，F(xiàn)有的圖形學(xué)技術(shù)發(fā)展了一系列快速的技術(shù)來(lái)模擬環(huán)境、物體和人的運(yùn)動(dòng)和復(fù)雜交互。然而，這些算法仍然存在復(fù)雜性高、計(jì)算不穩(wěn)定、收斂慢的問(wèn)題。尋找適用于不同場(chǎng)景的更為通用的模擬算法，發(fā)展快速數(shù)值解法，將深度學(xué)習(xí)技術(shù)用來(lái)加速優(yōu)化求解，以及利用增強(qiáng)學(xué)習(xí)技術(shù)進(jìn)行運(yùn)動(dòng)的規(guī)劃都是這一領(lǐng)域下一階段的研究重點(diǎn)。

人機(jī)交互與圖形學(xué)的深度結(jié)合

隨著新型傳感器、穿戴設(shè)備、VR/AR/MR設(shè)備的迅猛發(fā)展，人們有著更多的方式與機(jī)器打交道。這些新的輸入輸出方式也為圖形學(xué)研究帶來(lái)新的挑戰(zhàn)。如何使用多元異構(gòu)的數(shù)字輸入信息來(lái)指導(dǎo)生成符合用戶期望的三維影像與世界，如何針對(duì)不同設(shè)備設(shè)計(jì)便捷的輸入方式與交互手段，如何協(xié)同多用戶的操作并實(shí)時(shí)提供數(shù)字上和物理上的真實(shí)反饋、如何動(dòng)態(tài)調(diào)整已有算法以適配用戶的不斷更新的個(gè)性化要求等問(wèn)題，都值得圖形學(xué)研究者與從業(yè)者積極探討與深入研究。

計(jì)算機(jī)圖形學(xué)的未來(lái)：研究趨勢(shì)

通過(guò)上述內(nèi)容，我們可以很容易地看到，每個(gè)新的圖形學(xué)應(yīng)用場(chǎng)景都不可能由單一的一個(gè)圖形學(xué)技術(shù)來(lái)解決。為此，我們不僅需要在每個(gè)研究方向上進(jìn)一步努力，更需要借鑒最新的機(jī)器學(xué)習(xí)技術(shù)和計(jì)算機(jī)視覺(jué)技術(shù)，以及本領(lǐng)域的其他研究方向的技術(shù)和算法，才能最終解決問(wèn)題。

從基于物理和觀察的表達(dá)到基于學(xué)習(xí)的本征表達(dá)

現(xiàn)有的圖形學(xué)可以對(duì)單個(gè)三維對(duì)象的三維屬性進(jìn)行有效的表達(dá)和處理。但是對(duì)于所有的三維對(duì)象構(gòu)成的三維屬性空間，例如所有特定人造物體（椅子）的三維形狀空間,所有真實(shí)世界表面材質(zhì)的空間，或一個(gè)場(chǎng)景中所有光照傳輸路徑的空間，我們?nèi)匀蝗狈τ行У难芯亢捅磉_(dá)。隨著數(shù)據(jù)的增多和機(jī)器學(xué)習(xí)算法的應(yīng)用，這方面的研究慢慢成為可能。這些研究會(huì)導(dǎo)致三維信息新的表達(dá)形式的出現(xiàn)，即基于機(jī)器學(xué)習(xí)的三維形狀、材質(zhì)、行為等屬性空間的本征表達(dá)。這一表達(dá)會(huì)與傳統(tǒng)的基于物理的表達(dá)與基于觀測(cè)的表達(dá)共存。這一研究將成為圖形學(xué)的一個(gè)基礎(chǔ)理論問(wèn)題，并對(duì)我們研發(fā)高效的三維內(nèi)容建模、模擬和識(shí)別理解算法都具有極為重要的意義?；谶@一全新的表達(dá)，在圖形學(xué)研究中，如何有效的結(jié)合這一全新的表達(dá)和已有的表達(dá)，如何形成不同表達(dá)間的映射與轉(zhuǎn)換，也會(huì)成為一個(gè)重要的研究問(wèn)題。

在技術(shù)層，基于這一新的表達(dá)，機(jī)器學(xué)習(xí)技術(shù)將利用三維數(shù)據(jù)的本征屬性而不是物理屬性來(lái)解決三維內(nèi)容捕捉、生成、處理和模擬問(wèn)題。如何將機(jī)器學(xué)習(xí)技術(shù)有效地用于高維的三維圖形數(shù)據(jù)，結(jié)合用戶的交互輸入，是目前研究的熱點(diǎn)。進(jìn)一步將原有基于物理的方法與機(jī)器學(xué)習(xí)的方法有效結(jié)合，充分利用兩者的優(yōu)勢(shì)，也是圖形學(xué)研究中一個(gè)廣受關(guān)注和需要解決的重要問(wèn)題。

從屬性的單一表達(dá)到屬性的統(tǒng)一表達(dá)與融合

現(xiàn)有的圖形學(xué)對(duì)不同的三維屬性（形狀、表觀、動(dòng)態(tài)）具有各自單獨(dú)的表達(dá)和不同的處理方法。然而，一個(gè)三維對(duì)象（如物體）的表觀、形狀和行為并不是任意組合的，屬性之間也具有一定的約束和相關(guān)性。比如，一個(gè)木制的椅子由于材質(zhì)的限制，其椅腿的粗細(xì)和細(xì)節(jié)不可能是任意的。而它的表觀、重量和可能的運(yùn)動(dòng)特性也與木頭材質(zhì)屬性緊密相關(guān)。如何得到所有三維屬性更為簡(jiǎn)潔一致的表達(dá)是圖形學(xué)研究中的一個(gè)基礎(chǔ)問(wèn)題。

在技術(shù)和應(yīng)用層面，針對(duì)每個(gè)特定的應(yīng)用和問(wèn)題我們研發(fā)了可用的算法和解決方案。然而，這些算法或工具集是彼此孤立的。在目前的實(shí)際應(yīng)用中，我們需要具有領(lǐng)域知識(shí)的人將這些算法放在一起，輔以大量的人工和反復(fù)使用，調(diào)整修改每個(gè)工具的結(jié)果，反復(fù)迭代來(lái)達(dá)到最終的目標(biāo)。舉例來(lái)說(shuō)，為了設(shè)計(jì)一個(gè)像章魚(yú)爪子的軟體變形機(jī)械手，設(shè)計(jì)者可能需要先用造型軟件設(shè)計(jì)機(jī)器手外形，然后運(yùn)行仿真模擬軟件計(jì)算力學(xué)特性。設(shè)計(jì)好后，再運(yùn)行三維打印軟件進(jìn)行制造。制造好以后，進(jìn)行實(shí)際測(cè)試。由于每個(gè)模塊不知道最終的目標(biāo)，由此帶來(lái)的誤差需要人工反復(fù)修改并重復(fù)這一過(guò)程。

為此，我們需要將不同的技術(shù)方案，如幾何設(shè)計(jì)、仿真模擬、三維打印等有機(jī)地集成到一起，將每一步的約束引入到其他算法中，并允許所有的算法在統(tǒng)一的逆向優(yōu)化反饋框架下進(jìn)行自動(dòng)迭代，快速地生成滿足設(shè)計(jì)要求的結(jié)果。在最近幾年，越來(lái)越多的研究嘗試將不同的技術(shù)融合在一起，形成一個(gè)端到端的解決方案，這也成為了圖形學(xué)研究的一個(gè)趨勢(shì)。

從基礎(chǔ)工具集到智能系統(tǒng)的演進(jìn)

圖形學(xué)技術(shù)的一個(gè)重要目標(biāo)是將用戶的抽象設(shè)計(jì)意圖變成具體的三維對(duì)象。設(shè)計(jì)的最終目的是滿足一定的物理功能或故事情節(jié)的視覺(jué)展現(xiàn)。在功能和情節(jié)的約束下，最終得到美觀、成本合理的物理設(shè)計(jì)和視覺(jué)作品。目前，針對(duì)每個(gè)環(huán)節(jié)，已有的圖形學(xué)技術(shù)實(shí)現(xiàn)了基本的工具，可以幫助用戶完成形狀、表觀、動(dòng)態(tài)等底層三維屬性特性的生成、編輯，以及物理特性的模擬。然而，由于圖形學(xué)的屬性和對(duì)象表達(dá)缺乏對(duì)物理功能和語(yǔ)義的有效描述，使得現(xiàn)有的圖形學(xué)技術(shù)工具集無(wú)法幫助用戶有效的將高層抽象的功能和情節(jié)描述轉(zhuǎn)化為具體的三維屬性和表達(dá)。隨著機(jī)器學(xué)習(xí)的引入，圖形學(xué)技術(shù)的集成和表達(dá)的融合，圖形學(xué)研究將慢慢從三維信息的基礎(chǔ)設(shè)計(jì)和表達(dá)工具向高層語(yǔ)義的目標(biāo)進(jìn)發(fā)，最終實(shí)現(xiàn)從用戶的高層語(yǔ)義描述自動(dòng)生成三維內(nèi)容的最終目標(biāo)。

放眼未來(lái)，隨著計(jì)算機(jī)圖形學(xué)的進(jìn)一步發(fā)展，計(jì)算機(jī)輔助設(shè)計(jì)和制造技術(shù)的進(jìn)步，帶有傳感器的三維打印的個(gè)性化產(chǎn)品和機(jī)器人將被廣泛應(yīng)用于人類的實(shí)際生活和現(xiàn)實(shí)世界中。而真實(shí)環(huán)境的數(shù)據(jù)化孿生也將在計(jì)算機(jī)中實(shí)時(shí)地監(jiān)控著真實(shí)環(huán)境的動(dòng)態(tài)變化，規(guī)劃協(xié)調(diào)機(jī)器人高效地完成不同任務(wù)。而在虛擬世界中，隨著內(nèi)容創(chuàng)作工具的進(jìn)步，每個(gè)人的藝術(shù)天分都可以得到充分發(fā)揮，從而自由地創(chuàng)建自己的虛擬世界、游戲和虛擬化身。隨著下一代的虛擬現(xiàn)實(shí)設(shè)備和增強(qiáng)現(xiàn)實(shí)設(shè)備的出現(xiàn)，真實(shí)和虛擬的世界會(huì)得到更好的融合，新一代的人類將不需要再區(qū)分真實(shí)世界和虛擬世界。人、計(jì)算機(jī)（機(jī)器人和虛擬世界）和真實(shí)的物理世界將和諧高效地融合在一起，帶給人類一個(gè)超現(xiàn)實(shí)的世界。

本文作者：微軟亞洲研究院網(wǎng)絡(luò)圖形組