這個(gè)叫“達(dá)爾文”的機(jī)器人能跟兒童一樣學(xué)習(xí)
掃描二維碼
隨時(shí)隨地手機(jī)看文章
目前來(lái)說(shuō),機(jī)器人還停留在“機(jī)器”階段,實(shí)現(xiàn)這一跳躍的將是學(xué)習(xí)能力。難怪說(shuō)知識(shí)改變命運(yùn)~
據(jù)美國(guó)全國(guó)廣播公司新聞網(wǎng)媒體 News 12月7日?qǐng)?bào)道,美國(guó)加州大學(xué)伯克利分校機(jī)器人學(xué)習(xí)實(shí)驗(yàn)室的研究小組研發(fā)出一款名為達(dá)爾文(Darwin)的機(jī)器人,該機(jī)器人的一舉一動(dòng)都由數(shù)個(gè)擬神經(jīng)系統(tǒng)的網(wǎng)絡(luò)控制著。通過(guò)使用增強(qiáng)學(xué)習(xí)技術(shù),達(dá)爾文能夠模仿人類兒童大腦的學(xué)習(xí)方式對(duì)不同情況作出不一樣的反應(yīng)。
據(jù)報(bào)道,在加大伯克利分校的實(shí)驗(yàn)室中,達(dá)爾文像蹣跚學(xué)步的兒童一樣,搖搖晃晃,不斷跌倒,又不斷爬起,直到可以走得平穩(wěn)。這來(lái)源于研究人員用于達(dá)爾文的增強(qiáng)學(xué)習(xí)技術(shù),通過(guò)這種技術(shù),達(dá)爾文的神經(jīng)網(wǎng)絡(luò)能夠像人類兒童的大腦一樣運(yùn)轉(zhuǎn)試錯(cuò)過(guò)程。
“想象一下學(xué)一項(xiàng)新技能,比如學(xué)騎自行車,一開(kāi)始你會(huì)一直摔倒,但經(jīng)過(guò)一些練習(xí),你就能慢慢掌握竅門。”,機(jī)器人研究小組成員約翰•舒曼(John Schulman)如是說(shuō)。
機(jī)器人在平坦的地面行走沒(méi)有任何問(wèn)題,但當(dāng)任一變量(如臺(tái)階或斜坡)出現(xiàn)時(shí),它們就不知如何應(yīng)對(duì)了。在今年的DARPA機(jī)器人挑戰(zhàn)賽中,一些最頂尖的機(jī)器人要通過(guò)模擬真實(shí)世界災(zāi)難場(chǎng)景的障礙物,然而幾乎所有參與挑戰(zhàn)的機(jī)器人都沒(méi)能成功。
為了能使機(jī)器人在復(fù)雜的環(huán)境中靈活應(yīng)變,加大伯克利分校的研究小組在達(dá)爾文上使用了通用型神經(jīng)網(wǎng)絡(luò),這些網(wǎng)絡(luò)實(shí)際上就是模仿人類大腦進(jìn)行學(xué)習(xí)的算法。研究小組的另一位科學(xué)家塞吉•萊文(Sergey Levine)說(shuō)道:“這些算法中幾乎沒(méi)有具體動(dòng)作的算法指令。實(shí)際上,這些算法從一開(kāi)始就被設(shè)計(jì)成通用型的,它們不是具體的單一的走、握或洗碗動(dòng)作,而是能適用于所有這些動(dòng)作的算法。”
同時(shí),如果機(jī)器人能夠自我學(xué)習(xí),那么它運(yùn)行所需的硬件控制的人力投入就會(huì)減少,這樣就可以降低機(jī)器人的制造成本。
加州大學(xué)伯克利分校的科學(xué)家們希望能將擁有完全自主意識(shí)的機(jī)器人變成現(xiàn)實(shí),使機(jī)器人能夠靈活地執(zhí)行很多只有人類才能執(zhí)行的任務(wù)。赫伯特說(shuō),現(xiàn)在的機(jī)器人在很多情況下依然需要遠(yuǎn)程控制,例如在精確度要求非常高的任務(wù)執(zhí)行中。但最近的研究顯示機(jī)器人研發(fā)正從預(yù)先編程向不斷提高機(jī)器人的個(gè)例歸納能力轉(zhuǎn)變。
達(dá)爾文研發(fā)小組的負(fù)責(zé)人彼得•阿布比爾(Pieter Abbeel)教授表示要將這種轉(zhuǎn)變從模擬實(shí)驗(yàn)轉(zhuǎn)為實(shí)際應(yīng)用還要做大量工作,但它將對(duì)機(jī)器人研究產(chǎn)生重大影響。舒曼認(rèn)為:“這有可能使《星球大戰(zhàn)》中的人形機(jī)器人C-3PO變成現(xiàn)實(shí)。”