人工智能模型如何去思考物理世界

時(shí)間：2020-04-27 18:39:01

關(guān)鍵字：人工智能模型智能系統(tǒng) IBM

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 一項(xiàng)新的數(shù)據(jù)集揭示了人工智能在推理方面的糟糕程度，并表明一種新的混合方法可能是最好的解決方法。問(wèn)題：名為“CLEVRER”的數(shù)據(jù)集包括2萬(wàn)個(gè)合成視頻短片和超過(guò)30萬(wàn)個(gè)基于視頻中事件的問(wèn)

一項(xiàng)新的數(shù)據(jù)集揭示了人工智能在推理方面的糟糕程度，并表明一種新的混合方法可能是最好的解決方法。

問(wèn)題：名為“CLEVRER”的數(shù)據(jù)集包括2萬(wàn)個(gè)合成視頻短片和超過(guò)30萬(wàn)個(gè)基于視頻中事件的問(wèn)答配對(duì)。每個(gè)視頻都展示了一個(gè)簡(jiǎn)單的玩具物體的世界，它們?cè)谀M物理中相互碰撞。在其中一個(gè)實(shí)驗(yàn)，一個(gè)紅色的橡皮球撞到一個(gè)青色的橡膠圓筒上，青色的橡膠圓筒繼續(xù)打在一個(gè)金屬圓筒上。

這些問(wèn)題可以分為四類(lèi)：描述性的（例如，“與青色圓柱碰撞的物體是什么形狀？”）、解釋性的（“是什么導(dǎo)致了灰色圓柱與立方體的碰撞？”）、預(yù)測(cè)性的（“接下來(lái)會(huì)發(fā)生什么事件？”）和反事實(shí)的（“沒(méi)有灰色物體，哪個(gè)事件不會(huì)發(fā)生？”）。這些問(wèn)題反映了孩子們?cè)谔剿髦車(chē)h(huán)境時(shí)很早就學(xué)會(huì)的許多概念。但后三種需要因果推理才能回答的類(lèi)別，往往會(huì)阻礙深度學(xué)習(xí)系統(tǒng)。

失?。河晒鸫髮W(xué)、DeepMind和MIT-IBM沃森人工智能實(shí)驗(yàn)室的研究人員創(chuàng)建的數(shù)據(jù)集旨在幫助評(píng)估人工智能系統(tǒng)的推理能力。當(dāng)研究人員用數(shù)據(jù)集測(cè)試了幾種最先進(jìn)的計(jì)算機(jī)視覺(jué)和自然語(yǔ)言模型時(shí)，他們發(fā)現(xiàn)所有這些模型在描述性問(wèn)題上都做得很好，但在其他問(wèn)題上卻做得很差。

新舊結(jié)合：該團(tuán)隊(duì)隨后嘗試了一種結(jié)合深度學(xué)習(xí)和符號(hào)邏輯的新人工智能系統(tǒng)。在20世紀(jì)80年代末被機(jī)器學(xué)習(xí)取代之前，符號(hào)系統(tǒng)曾經(jīng)風(fēng)靡一時(shí)。但這兩種方法都有各自的優(yōu)勢(shì)：深度學(xué)習(xí)在可擴(kuò)展性和模式識(shí)別方面更勝一籌;符號(hào)系統(tǒng)更擅長(zhǎng)抽象和推理。

這個(gè)復(fù)合系統(tǒng)被稱(chēng)為神經(jīng)符號(hào)模型，它利用了這兩方面：一方面使用一個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)識(shí)別物體的顏色、形狀和材料;另一方面使用一個(gè)符號(hào)系統(tǒng)來(lái)理解物體運(yùn)動(dòng)的物理性質(zhì)和它們之間的因果關(guān)系。它在所有類(lèi)型的問(wèn)題上都優(yōu)于現(xiàn)有的模型。

重要性：作為孩子，我們學(xué)會(huì)觀察周?chē)氖澜?，推斷事情為什么?huì)發(fā)生，并預(yù)測(cè)接下來(lái)會(huì)發(fā)生什么。這些預(yù)測(cè)幫助我們做出更好的決定，駕馭我們的環(huán)境，保持安全。在機(jī)器中復(fù)制這種因果理解同樣會(huì)使它們以更智能的方式與世界互動(dòng)。