這個(gè)叫“達(dá)爾文”的機(jī)器人能跟兒童一樣學(xué)習(xí)

時(shí)間：2015-12-08 16:42:17

關(guān)鍵字：機(jī)器人模擬神經(jīng)網(wǎng)絡(luò) WIN

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]目前來(lái)說(shuō)，機(jī)器人還停留在“機(jī)器”階段，實(shí)現(xiàn)這一跳躍的將是學(xué)習(xí)能力。難怪說(shuō)知識(shí)改變命運(yùn)~ 據(jù)美國(guó)全國(guó)廣播公司新聞網(wǎng)媒體 News 12月7日?qǐng)?bào)道，美國(guó)加州大學(xué)伯克利分校機(jī)器人學(xué)習(xí)實(shí)驗(yàn)室的研究小組研發(fā)出一款

目前來(lái)說(shuō)，機(jī)器人還停留在“機(jī)器”階段，實(shí)現(xiàn)這一跳躍的將是學(xué)習(xí)能力。難怪說(shuō)知識(shí)改變命運(yùn)~

據(jù)美國(guó)全國(guó)廣播公司新聞網(wǎng)媒體 News 12月7日?qǐng)?bào)道，美國(guó)加州大學(xué)伯克利分校機(jī)器人學(xué)習(xí)實(shí)驗(yàn)室的研究小組研發(fā)出一款名為達(dá)爾文(Darwin)的機(jī)器人，該機(jī)器人的一舉一動(dòng)都由數(shù)個(gè)擬神經(jīng)系統(tǒng)的網(wǎng)絡(luò)控制著。通過(guò)使用增強(qiáng)學(xué)習(xí)技術(shù)，達(dá)爾文能夠模仿人類兒童大腦的學(xué)習(xí)方式對(duì)不同情況作出不一樣的反應(yīng)。

據(jù)報(bào)道，在加大伯克利分校的實(shí)驗(yàn)室中，達(dá)爾文像蹣跚學(xué)步的兒童一樣，搖搖晃晃，不斷跌倒，又不斷爬起，直到可以走得平穩(wěn)。這來(lái)源于研究人員用于達(dá)爾文的增強(qiáng)學(xué)習(xí)技術(shù)，通過(guò)這種技術(shù)，達(dá)爾文的神經(jīng)網(wǎng)絡(luò)能夠像人類兒童的大腦一樣運(yùn)轉(zhuǎn)試錯(cuò)過(guò)程。

“想象一下學(xué)一項(xiàng)新技能，比如學(xué)騎自行車，一開(kāi)始你會(huì)一直摔倒，但經(jīng)過(guò)一些練習(xí)，你就能慢慢掌握竅門。”，機(jī)器人研究小組成員約翰•舒曼(John Schulman)如是說(shuō)。

機(jī)器人在平坦的地面行走沒(méi)有任何問(wèn)題，但當(dāng)任一變量(如臺(tái)階或斜坡)出現(xiàn)時(shí)，它們就不知如何應(yīng)對(duì)了。在今年的DARPA機(jī)器人挑戰(zhàn)賽中，一些最頂尖的機(jī)器人要通過(guò)模擬真實(shí)世界災(zāi)難場(chǎng)景的障礙物，然而幾乎所有參與挑戰(zhàn)的機(jī)器人都沒(méi)能成功。

為了能使機(jī)器人在復(fù)雜的環(huán)境中靈活應(yīng)變，加大伯克利分校的研究小組在達(dá)爾文上使用了通用型神經(jīng)網(wǎng)絡(luò)，這些網(wǎng)絡(luò)實(shí)際上就是模仿人類大腦進(jìn)行學(xué)習(xí)的算法。研究小組的另一位科學(xué)家塞吉•萊文(Sergey Levine)說(shuō)道：“這些算法中幾乎沒(méi)有具體動(dòng)作的算法指令。實(shí)際上，這些算法從一開(kāi)始就被設(shè)計(jì)成通用型的，它們不是具體的單一的走、握或洗碗動(dòng)作，而是能適用于所有這些動(dòng)作的算法。”

同時(shí)，如果機(jī)器人能夠自我學(xué)習(xí)，那么它運(yùn)行所需的硬件控制的人力投入就會(huì)減少，這樣就可以降低機(jī)器人的制造成本。

加州大學(xué)伯克利分校的科學(xué)家們希望能將擁有完全自主意識(shí)的機(jī)器人變成現(xiàn)實(shí)，使機(jī)器人能夠靈活地執(zhí)行很多只有人類才能執(zhí)行的任務(wù)。赫伯特說(shuō)，現(xiàn)在的機(jī)器人在很多情況下依然需要遠(yuǎn)程控制，例如在精確度要求非常高的任務(wù)執(zhí)行中。但最近的研究顯示機(jī)器人研發(fā)正從預(yù)先編程向不斷提高機(jī)器人的個(gè)例歸納能力轉(zhuǎn)變。

達(dá)爾文研發(fā)小組的負(fù)責(zé)人彼得•阿布比爾(Pieter Abbeel)教授表示要將這種轉(zhuǎn)變從模擬實(shí)驗(yàn)轉(zhuǎn)為實(shí)際應(yīng)用還要做大量工作，但它將對(duì)機(jī)器人研究產(chǎn)生重大影響。舒曼認(rèn)為：“這有可能使《星球大戰(zhàn)》中的人形機(jī)器人C-3PO變成現(xiàn)實(shí)。”