DeepMind人工智能可以將平面圖像生成3D圖像

時間：2020-08-04 16:51:02

關(guān)鍵字：人工智能神經(jīng)網(wǎng)絡(luò) 谷歌

手機(jī)看文章

掃描二維碼
隨時隨地手機(jī)看文章

[導(dǎo)讀] 據(jù)外媒報道，谷歌母公司Alphabet旗下DeepMind最近開發(fā)了一種人工智能技術(shù)，它可以在觀察2D平面圖像之后以3D渲染整個場景。目前一些人工智能研究人員正在試圖教機(jī)器學(xué)習(xí)像人類一樣。我們不

據(jù)外媒報道，谷歌母公司Alphabet旗下DeepMind最近開發(fā)了一種人工智能技術(shù)，它可以在觀察2D平面圖像之后以3D渲染整個場景。目前一些人工智能研究人員正在試圖教機(jī)器學(xué)習(xí)像人類一樣。我們不是以像素為單位看世界，而是環(huán)顧我們的環(huán)境并對其中的一切進(jìn)行假設(shè)。

DeepMind團(tuán)隊則訓(xùn)練了一個人工智能如何從其未見的角度猜測事物的樣子。 DeepMind的科學(xué)家提出了一個生成查詢網(wǎng)絡(luò)（GeneraTIve Query Network，GQN），這是一個神經(jīng)網(wǎng)絡(luò)，旨在教人工智能如何從不同的角度想象物體的場景會是什么樣子?；旧?，人工智能觀察場景的2D平面圖像，然后嘗試重新創(chuàng)建它。在這種情況下，重要的是DeepMind的人工智能不使用任何人為標(biāo)記的輸入等。它只觀察三幅圖像，并開始預(yù)測場景的3D版本是什么樣子。

研究人員正在努力實現(xiàn)“完全無監(jiān)督的場景理解”。目前人工智能尚未接受真實世界的圖像訓(xùn)練，因此下一步將從照片中渲染逼真的場景。未來，DeepMind基于GQN的人工智能可能只使用照片就可以生成與現(xiàn)實世界幾乎完全相同的按需3D場景。