深入Facebook全新機(jī)器人實(shí)驗(yàn)室 AI和機(jī)器共織未來(lái)
乍一看,F(xiàn)acebook新生的機(jī)器人平臺(tái)看起來(lái)有點(diǎn)混亂。在這家公司硅谷總部的一個(gè)新實(shí)驗(yàn)室里,一只紅黑相間的Sawyer機(jī)器人手臂(來(lái)自最近倒閉的Rethink Robotics)不斷揮舞著,發(fā)出嗚嗚的機(jī)械聲。照理說(shuō),它應(yīng)該可以把手臂移動(dòng)到右邊空間中的一個(gè)位置,但是它卻向上移動(dòng),偏離設(shè)置的方向,并重置到起始位置。終于,它的手臂向右移動(dòng)了,非常接近目標(biāo)位置。但是,它卻再次瘋狂地偏離了方向,不得不被再次重置。
不過(guò),就像一只兔子為了躲避獵鷹而來(lái)回曲折,這個(gè)機(jī)器人看似瘋狂實(shí)際上卻是很聰明的。Facebook認(rèn)為它既是開(kāi)發(fā)更好機(jī)器人,也是開(kāi)發(fā)更好人工智能的關(guān)鍵。也就是說(shuō),這個(gè)機(jī)器人正在自學(xué)探索世界。Facebook表示,未來(lái)有一天,將會(huì)出現(xiàn)像遠(yuǎn)程呈現(xiàn)機(jī)器人一樣的智能機(jī)器。
當(dāng)然,目前的機(jī)器人仍處于非常笨拙的狀態(tài)——一般來(lái)說(shuō),你必須用代碼為它們說(shuō)明一切:這是你向前滾動(dòng)的方式,這是你移動(dòng)手臂的方式。我們?nèi)祟?lèi)在學(xué)習(xí)方式上要聰明得多。甚至嬰兒也明白,一個(gè)從視野中消失的物體并沒(méi)有從物理世界中消失。他們知道可以滾動(dòng)球,但無(wú)法滾動(dòng)沙發(fā)。從沙發(fā)上摔下來(lái)沒(méi)關(guān)系,但從懸崖上摔下來(lái)卻不是。
所有這些實(shí)驗(yàn)都在你的大腦中建立了一個(gè)世界模型,這就是為什么你可以在學(xué)會(huì)駕駛汽車(chē)后,不會(huì)立馬撞車(chē)。Facebook首席人工智能科學(xué)家Yann LeCun說(shuō):“我們事先知道,如果開(kāi)車(chē)靠近懸崖,然后向右轉(zhuǎn)動(dòng)方向盤(pán),汽車(chē)就會(huì)從懸崖上掉下來(lái),不會(huì)有什么好事發(fā)生?!蔽覀冾^腦中有一個(gè)自學(xué)的模型,可以防止我們做傻事。Facebook也試圖給機(jī)器提供這種模式?!霸谖铱磥?lái),學(xué)習(xí)世界模型的系統(tǒng)是在人工智能領(lǐng)域真正取得重大進(jìn)展的下一個(gè)挑戰(zhàn),”LeCun補(bǔ)充道。
不過(guò),F(xiàn)acebook的研究小組并不是第一個(gè)試圖讓機(jī)器人自學(xué)移動(dòng)的團(tuán)隊(duì)。在加州大學(xué)伯克利分校,一組研究人員使用了一種叫做強(qiáng)化學(xué)習(xí)的技術(shù),來(lái)教一個(gè)名叫Brett的雙臂機(jī)器人把一個(gè)方釘塞進(jìn)一個(gè)方孔里。簡(jiǎn)而言之,機(jī)器人嘗試了許許多多的隨機(jī)運(yùn)動(dòng)。如果在一次移動(dòng)中更接近目標(biāo),系統(tǒng)會(huì)給它一個(gè)數(shù)字“獎(jiǎng)勵(lì)”。如果它搞砸了,它會(huì)被數(shù)字“記過(guò)”。經(jīng)過(guò)多次反復(fù),尋求獎(jiǎng)勵(lì)的機(jī)器人會(huì)讓它的手越來(lái)越靠近那個(gè)方孔,最后把釘子放進(jìn)去。
讓機(jī)器人擁有“好奇心”
Facebook正在做的實(shí)驗(yàn)有點(diǎn)不同?!拔覀兿胍獓L試的是灌輸這種好奇心的觀念,”Facebook人工智能研究科學(xué)家Franziska Meier說(shuō)。人類(lèi)就是這樣學(xué)會(huì)操縱物體的:孩子們被對(duì)世界的好奇心所驅(qū)使。他們嘗試新的東西,比如拽貓的尾巴,并不是因?yàn)樗麄儽仨氝@么做,而是他們想知道如果這樣做了會(huì)發(fā)生什么。
因此,盡管像Brett這樣的機(jī)器人會(huì)一點(diǎn)一點(diǎn)地完善自己的動(dòng)作,但Facebook的機(jī)械臂卻可能會(huì)出現(xiàn)靠近目標(biāo)時(shí)偏離方向的現(xiàn)象。這是因?yàn)檠芯咳藛T沒(méi)有獎(jiǎng)勵(lì)它增量成功,而是給予它嘗試非最佳動(dòng)作的自由。它在嘗試新的東西,即使這些東西現(xiàn)在看起來(lái)并不特別理性。
每次移動(dòng)都為系統(tǒng)提供數(shù)據(jù)。在每個(gè)關(guān)節(jié)上施加扭矩是為了把手臂移動(dòng)到那個(gè)特定的位置。Meier說(shuō):“雖然沒(méi)有完成任務(wù),但它給了我們更多的數(shù)據(jù),我們通過(guò)這樣的探索獲得的數(shù)據(jù)種類(lèi)比不探索時(shí)要多?!边@個(gè)概念被稱為自我監(jiān)督學(xué)習(xí)——機(jī)器人嘗試新事物并更新軟件模型,這可以幫助它預(yù)測(cè)其行為的后果。
這個(gè)想法是為了讓機(jī)器更靈活,對(duì)一項(xiàng)任務(wù)不那么專(zhuān)一。我們可以把它想象成完成一個(gè)迷宮。也許機(jī)器人知道它需要朝哪個(gè)方向前進(jìn)才能找到出口。它可能會(huì)一次又一次地嘗試到達(dá)那里,即使它不可避免地會(huì)在那次追逐中陷入死胡同。奧斯陸大學(xué)機(jī)器人專(zhuān)家Tnnes Nygaard說(shuō):“由于你如此專(zhuān)注于向那個(gè)方向移動(dòng),你可能會(huì)走進(jìn)角落?!彼呀?jīng)開(kāi)發(fā)出一種四足機(jī)器人,可以自己學(xué)會(huì)走路。(Facebook也在嘗試讓一個(gè)六腿機(jī)器人自己行走,但是在我參觀實(shí)驗(yàn)室的時(shí)候該公司尚未能進(jìn)行展示。)“與其如此專(zhuān)注于說(shuō),我想朝著我知道解決方案所在的方向前進(jìn),不如我試著專(zhuān)注于探索。我將嘗試尋找新的解決方案?!?/p>
所以Facebook的機(jī)器人手臂做出的那些看似不連貫的動(dòng)作實(shí)際上是一種好奇心,正是這種好奇心可以讓機(jī)器更容易適應(yīng)環(huán)境。想象一下一個(gè)家用機(jī)器人正試圖填裝洗碗機(jī)。也許它認(rèn)為把杯子放在頂部架子上最有效的方法是從側(cè)面拿過(guò)來(lái),在這種情況下杯子會(huì)碰到架子的邊緣。從某種意義上說(shuō),這是確定性的:一次又一次的反復(fù)嘗試,讓它走上這條不太理想的道路,在這條道路上,它試圖更好地側(cè)向裝載,但現(xiàn)在它無(wú)法備份并嘗試新的東西。另一方面,一個(gè)充滿好奇心的機(jī)器人可以通過(guò)實(shí)驗(yàn)和學(xué)習(xí),了解到從上面進(jìn)來(lái)實(shí)際上是最好的方法。它是靈活的,不是決定性的,這在理論上允許它更容易適應(yīng)動(dòng)態(tài)的人類(lèi)環(huán)境。
模擬無(wú)法替代現(xiàn)實(shí)
現(xiàn)在,一種更簡(jiǎn)單、更快捷的教機(jī)器人做事的方法是模擬。也就是說(shuō),建立一個(gè)數(shù)字世界,比如說(shuō),一個(gè)動(dòng)畫(huà)棒形人物,讓它教自己用同樣的試錯(cuò)法運(yùn)行。這種方法相對(duì)較快,因?yàn)楫?dāng)數(shù)字“機(jī)器”不受現(xiàn)實(shí)物理定律的約束時(shí),迭代會(huì)快得多。
盡管模擬可能更有效,但它并不是真實(shí)世界的完美表現(xiàn)——你無(wú)法完全模擬動(dòng)態(tài)人類(lèi)環(huán)境的復(fù)雜性。因此,盡管研究人員已經(jīng)能夠訓(xùn)練機(jī)器人首先在模擬中做一些事情,然后將這些知識(shí)傳遞給現(xiàn)實(shí)世界中的機(jī)器人,但這種轉(zhuǎn)變極其混亂,因?yàn)閿?shù)字世界和物理世界是不匹配的。
在現(xiàn)實(shí)世界中做任何事情可能會(huì)更慢、更費(fèi)力,但從某種意義上來(lái)說(shuō),你得到的數(shù)據(jù)更純粹。Facebook人工智能研究科學(xué)家Roberto Calandra說(shuō):“如果它在現(xiàn)實(shí)世界中有效,那它實(shí)際上就是有效的。”如果你在設(shè)計(jì)極其復(fù)雜的機(jī)器人,你無(wú)法模擬他們將要應(yīng)對(duì)的人類(lèi)世界的混亂。但它們必須繼續(xù)生存下去。隨著我們給機(jī)器人的任務(wù)變得越來(lái)越復(fù)雜,這一點(diǎn)尤為重要。在工廠生產(chǎn)線上提升車(chē)門(mén)的機(jī)器人相對(duì)來(lái)說(shuō)很容易編碼,但卻無(wú)法在混亂的家庭中導(dǎo)航。機(jī)器人將不得不憑借創(chuàng)造力自行適應(yīng),這樣它就不會(huì)被困在反饋回路中。一個(gè)程序員不能對(duì)每一個(gè)障礙都進(jìn)行編程。
Facebook的項(xiàng)目是人工智能和機(jī)器人完美結(jié)合的一部分。傳統(tǒng)上,這些世界很大程度上是封閉的。是的,機(jī)器人總是需要人工智能來(lái)自主操作,就像使用機(jī)器視覺(jué)來(lái)感知世界一樣。但是,盡管像谷歌、亞馬遜和Facebook這樣的科技巨頭推動(dòng)了純數(shù)字環(huán)境下人工智能發(fā)展的重大進(jìn)步——讓計(jì)算機(jī)識(shí)別圖像中的物體,例如,讓人類(lèi)先給這些物體貼上標(biāo)簽——但機(jī)器人仍然相當(dāng)愚笨,因?yàn)檠芯咳藛T一直專(zhuān)注于讓物體在不摔倒的情況下移動(dòng)。
隨著人工智能研究人員開(kāi)始使用機(jī)器人作為平臺(tái)來(lái)完善軟件算法,這種情況開(kāi)始改變。例如,F(xiàn)acebook可能想教機(jī)器人自己解決一系列任務(wù)。這反過(guò)來(lái)可能會(huì)為人工智能助手的發(fā)展提供信息,它們可以更好地為你、為用戶,計(jì)劃一系列的行動(dòng)?!斑@是同一個(gè)問(wèn)題,”LeCun說(shuō)?!叭绻隳茉谝粋€(gè)環(huán)境中解決它,那么你也可以在另一個(gè)環(huán)境中解決?!?/p>
換句話說(shuō),人工智能正在使機(jī)器人變得更聰明,但是機(jī)器人現(xiàn)在也在幫助推進(jìn)人工智能?!霸S多與人工智能相關(guān)的有趣問(wèn)題——特別是人工智能的未來(lái),比如我們?nèi)绾尾拍苓_(dá)到人類(lèi)水平的人工智能——目前正由機(jī)器人領(lǐng)域的工作人員來(lái)解決,”LeCun說(shuō)?!耙?yàn)槟悴荒苡脵C(jī)器人作弊。你不能讓成千上萬(wàn)的人給你貼標(biāo)簽?!?/p>
當(dāng)然,我們?nèi)匀挥幸蓡?wèn),像Facebook這樣的數(shù)字巨獸想要機(jī)器人做什么?目前,該公司表示這項(xiàng)研究與特定的產(chǎn)品渠道無(wú)關(guān)。
但是請(qǐng)記住,F(xiàn)acebook從事于人際關(guān)系業(yè)務(wù)(也從事廣告銷(xiāo)售業(yè)務(wù))?!拔覀冋J(rèn)為機(jī)器人技術(shù)將是其中的一個(gè)重要組成部分——想想遠(yuǎn)程呈現(xiàn)之類(lèi)的東西,”LeCun說(shuō)。畢竟,F(xiàn)acebook已經(jīng)是一家硬件公司,生產(chǎn)了視頻會(huì)議設(shè)備Oculus VR系統(tǒng)和Portal。“這種邏輯上的連續(xù)性也許是你可以從遠(yuǎn)處控制的事情。”
但我們正在超越自己。迄今為止,除了Roomba,每一個(gè)家庭機(jī)器人都失敗了,部分原因是這些機(jī)器不夠智能或不夠有用。是的,沒(méi)有機(jī)器人能夠特別聰明,但是,也許Facebook這個(gè)揮動(dòng)的機(jī)械臂可以幫助解決這個(gè)問(wèn)題。