當前位置:首頁 > 智能硬件 > 智能硬件
[導(dǎo)讀]加州大學(xué)伯克利分校的計算機科學(xué)家們研發(fā)出“可以預(yù)見未來要發(fā)生的事情”的機器人技術(shù)。運用視覺預(yù)見技術(shù),在完全自主學(xué)習(xí)的情況下,這種機器人可以看到如果他們執(zhí)行特定的動作會產(chǎn)生怎樣的結(jié)果。目前的機器人原型還比較簡單,只能預(yù)測幾秒的未來,研究者在NIPS 2017上展示了這項技術(shù)。

加州大學(xué)伯克利分校的計算機科學(xué)家們研發(fā)出“可以預(yù)見未來要發(fā)生的事情”的機器人技術(shù)。運用視覺預(yù)見技術(shù),在完全自主學(xué)習(xí)的情況下,這種機器人可以看到如果他們執(zhí)行特定的動作會產(chǎn)生怎樣的結(jié)果。目前的機器人原型還比較簡單,只能預(yù)測幾秒的未來,研究者在NIPS 2017上展示了這項技術(shù)。

對于嬰幼兒來說,玩玩具不僅僅是樂趣和游戲,這對他們學(xué)習(xí)和理解世界的運作方式是很重要的。受此啟發(fā),加州大學(xué)伯克利分校的研究人員開發(fā)了一個機器人,像嬰兒一樣,它從零開始學(xué)習(xí)理解世界,用物體進行實驗,找出如何以最好的路徑移動物體。這樣,機器人能夠“看到”未來要發(fā)生的事情。

這個機器人名為Vestri,它像嬰兒一樣通過擺玩物體來想象如何完成任務(wù)。

UC Berkeley的研究人員開發(fā)了一種機器人學(xué)習(xí)技術(shù),使機器人能夠想象自己的行為的未來,這樣它們就能夠知道如何操作以前從未遇到過的物體。未來,這項技術(shù)可以幫助自動駕駛汽車預(yù)測未來的路況,或者實現(xiàn)更智能的家庭機器人助理,但這個最初的原型專注于從完全自主的游戲中學(xué)習(xí)簡單的動手技能。

這一技術(shù)被稱為“視覺預(yù)見”(visual foresight),使用這種技術(shù),機器人能夠預(yù)測在執(zhí)行某個動作的一個步驟時,它們的攝像機將會看到什么。這些機器人的想象力在現(xiàn)在還比較簡單——只能預(yù)測幾秒鐘的未來——但是它們足夠讓機器人弄清楚如何在桌子上移動物體,而不會碰到障礙物。重要的是,機器人可以在沒有人類的幫助的情況下學(xué)會執(zhí)行這些任務(wù),也不需要有關(guān)物理、環(huán)境或物體的先有知識。這是因為視覺想象力是在無監(jiān)督的探索中從頭開始學(xué)習(xí)的,只有機器人在桌子上擺玩物體。在這個游戲階段之后,機器人構(gòu)建了一個有關(guān)世界的預(yù)測模型,并且可以使用這個模型來操縱它以前從未見過的新物體。

“就像我們?nèi)祟惪梢韵胂笪覀兊膭幼鲗⑷绾我苿迎h(huán)境中的物體一樣,這種方法可以讓機器人想象不同的動作對周圍的世界將產(chǎn)生怎樣的影響,”伯克利大學(xué)電子工程和計算機科學(xué)系助理教授Sergey Levine說,他所在的實驗室開發(fā)了這項技術(shù)。“這可以在復(fù)雜的現(xiàn)實世界中實現(xiàn)對高度靈活的技能進行智能規(guī)劃。”

研究團隊NIPS 2017大會上進行了視覺預(yù)見技術(shù)的demo。

這個系統(tǒng)的核心是基于卷積循環(huán)視頻預(yù)測(convolutional recurrent video prediction)或dynamic neural advection (DNA)的深度學(xué)習(xí)技術(shù)。基于DNA的模型根據(jù)機器人的動作預(yù)測圖像中的像素如何從一個幀移動到下一幀。最近對這類模型的改進,以及大大提高的規(guī)劃能力,使得基于視頻預(yù)測的機器人控制能夠執(zhí)行越來越復(fù)雜的任務(wù),例如在障礙物周圍移動玩具并重新定位多個物體。

“在過去,機器人已經(jīng)能夠在人類主管協(xié)助并提供反饋的條件下學(xué)會技能,這項新工作令人興奮的地方在于,機器人可以完全自主地學(xué)習(xí)一系列的視覺對象操作技能。”Levine實驗室的一名博士學(xué)生、最初的DNA模型的發(fā)明人Chelsea Finn說。

利用這項新技術(shù),機器人將物體推到桌子上,然后利用所學(xué)習(xí)的預(yù)測模型來選擇將物體移動到所需位置的動作。機器人利用從原始攝像頭觀察的學(xué)習(xí)模型來自學(xué)如何避開障礙物,并在障礙物周圍推動物體。

“人類的一生中,通過數(shù)百萬次與各種各樣的物體的互動,在沒有任何教師的情況下學(xué)習(xí)操控物體的技能。我們已經(jīng)證明,建立一個利用大量的自主收集的數(shù)據(jù)來學(xué)習(xí)廣泛適用的操作技能的機器人系統(tǒng)也是可行的,特別是推動物體這一技能。”Frederik Ebert說,他是Levine實驗室的一名研究生,這個項目的研究者之一。

由于通過視頻預(yù)測的控制僅依賴于可以由機器人自主收集的觀察,例如通過攝像機收集的圖像,因此這一方法是通用的,具有廣泛的適用性。與傳統(tǒng)的計算機視覺方法不同,傳統(tǒng)的計算機視覺方法需要人類為數(shù)千甚至數(shù)百萬圖像進行手工標記,構(gòu)建視頻預(yù)測模型只需要未標注的視頻,因此可以完全由機器人自主采集。事實上,視頻預(yù)測模型也已經(jīng)被應(yīng)用于從人類活動到駕駛的各種數(shù)據(jù)集,并且取得了令人信服的結(jié)果。

Levine說:“嬰兒可以通過玩玩具、擺動玩具、抓握等等來理解世界。我們的目標是讓機器人做同樣的事情:通過自主的互動來了解世界是如何運作的。”他說:“這個機器人的能力雖然仍然有限,但它的技能完全是自主學(xué)習(xí)的,這讓它可以通過構(gòu)建之前觀察到的互動模式來預(yù)測復(fù)雜的物理互動。”

UC Berkeley的科學(xué)家們將繼續(xù)通過視頻預(yù)測研究機器人控制,專注于進一步改進視頻預(yù)測和基于預(yù)測的控制,以及開發(fā)更復(fù)雜的方法,使機器人可以收集更集中的視頻數(shù)據(jù),用于復(fù)雜的任務(wù),例如拾取和放置物體,操縱布或繩索等柔軟和可變形的物體,以及組裝。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉