人形機(jī)器人進(jìn)入家庭 至少還需要五年
隨著華人力量在人工智能研究領(lǐng)域的崛起,越來越多的華人科學(xué)家投身于人工智能技術(shù)商業(yè)化的進(jìn)程中。
近日,優(yōu)必選科技宣布悉尼大學(xué)教授陶大程即將加盟公司,并擔(dān)任優(yōu)必選“人工智能首席科學(xué)家”。同時(shí),在機(jī)器人運(yùn)動(dòng)控制方面,清華大學(xué)教授趙明國也將擔(dān)任優(yōu)必選“人形機(jī)器人首席科學(xué)家”。陶大程、趙明國以及優(yōu)必選創(chuàng)始人周劍在北京接受了包括《第一財(cái)經(jīng)日?qǐng)?bào)》在內(nèi)的媒體采訪,對(duì)于人形機(jī)器人商業(yè)化等一系列有趣的問題進(jìn)行了探討。
進(jìn)入家庭的四個(gè)門檻
優(yōu)必選在人形機(jī)器人方面的戰(zhàn)略是,2018年完成大扭矩、高爆發(fā)力伺服舵機(jī)研發(fā)商業(yè)化,并推出系列化雙足家庭服務(wù)機(jī)器人。同時(shí)考慮在三年內(nèi)推出人形家庭服務(wù)機(jī)器人操作系統(tǒng),并推出基于商業(yè)化目的的類人家庭服務(wù)機(jī)器人。
周劍認(rèn)為,人類的需求不是特定的,也許有人會(huì)需要真人一樣的、有情感依賴的機(jī)器人陪伴在身邊,如果是單身的話,想象空間就很大了。這樣的機(jī)器人5~8年之內(nèi)商業(yè)化是有可能的。未來人形機(jī)器人在運(yùn)動(dòng)控制和人工智能上將無限接近人。
“我們跟亞馬遜一起討論了很久,亞馬遜認(rèn)為未來的人機(jī)交互的發(fā)展,消費(fèi)中心一定是人形機(jī)器人。”周劍提到,2017年優(yōu)必選的主要收入來源有四塊,銷售收入將達(dá)到10億到15億元人民幣。其中之一就是和亞馬遜合作開發(fā)的機(jī)器人。
陶大程從軟件的角度解析了人形機(jī)器人四個(gè)方面的研究內(nèi)容。他指出,人形機(jī)器人最關(guān)鍵的東西是視覺輸出。我們每天所獲取的信息超過70%、80%都是從眼睛來的,所以首先是要進(jìn)行圖像處理,如何將獲取的圖像變得更加清晰??辞宄?,就是機(jī)器識(shí)別,作為家庭服務(wù)機(jī)器人,首先要認(rèn)識(shí)家里每一個(gè)成員,這樣才能對(duì)他們建立用戶畫像,然后把家庭成員的信息歸總起來。要想完成穩(wěn)定的圖像處理和機(jī)器視覺,離不開兩個(gè)非常關(guān)鍵的基礎(chǔ)方面的研究,即深度學(xué)習(xí)和多視角學(xué)習(xí)。
他表示,機(jī)器人在家里到處走,要進(jìn)行實(shí)時(shí)場景的解析,如何精確地實(shí)現(xiàn)室內(nèi)導(dǎo)航,要有很多基礎(chǔ)技術(shù)的支持。理解了環(huán)境,下面很重要的事情就是認(rèn)知人、理解人的行為,這是運(yùn)動(dòng)的人臉識(shí)別系統(tǒng)。人是有情感的,你可以很友善,也可以很憤怒。這對(duì)于機(jī)器人來說就需要理解人的表情。理解了人的情緒、人的行為,下面就要知道如何檢測和識(shí)別物體。
陶大程認(rèn)為,人形機(jī)器人最終面向家庭的商業(yè)化還是要降低成本,而最大的問題就是要估計(jì)人的姿態(tài),如果給機(jī)器人裝很多攝像頭和傳感器必定會(huì)提高成本,如何利用單幕攝像機(jī)來獲取想要的數(shù)據(jù)就是需要研究的問題。其團(tuán)隊(duì)最近的一個(gè)研究成果就是從Youtube下載的視頻進(jìn)行計(jì)算。
此外,還有一個(gè)關(guān)鍵問題是模型壓縮。人形機(jī)器人運(yùn)動(dòng)過程當(dāng)中有很多計(jì)算的開銷、電能的開銷,再加上人工智能的開銷,就導(dǎo)致它要有一個(gè)很大的電池,這在很多場景中是很難克服的,因此要把大的模型變成小的模型。
5年內(nèi)或迎來突破
專注雙足機(jī)器人運(yùn)動(dòng)控制技術(shù)研究的趙明國教授認(rèn)為,在基本功能達(dá)到之后,就可以不斷迭代,真正產(chǎn)生一個(gè)符合需求的產(chǎn)品。在兩到三年之內(nèi),機(jī)器人“抓取”的功能一定能到位。
以“抓取”這個(gè)功能為例,家里各式各樣的瓶子很多,酒杯、礦泉水瓶、暖水瓶等等,可能在機(jī)器人看來都是一樣的,但如何精準(zhǔn)地把這些物體識(shí)別出來,就是需要人工智能技術(shù)和運(yùn)動(dòng)控制技術(shù)相互配合的場景。
趙明國還談到,真正的人形機(jī)器人是有四肢、大腦及軀干的機(jī)器人,只是它的外形不見得是第一步就完成的。先完成整體軀干的部分,可以運(yùn)動(dòng)了,有了AI的概念了,然后再做更加真人化的皮膚、材料、各種傳感器,這時(shí)候觸感、溫度各方面才會(huì)有進(jìn)步。
“未來5年結(jié)合驅(qū)動(dòng)技術(shù)、控制技術(shù),以及人工智能的發(fā)展,一定會(huì)迎來人形機(jī)器人在家庭應(yīng)用中新的突破點(diǎn),也會(huì)迎來產(chǎn)業(yè)應(yīng)用的突破。”趙明國表示。
開發(fā)一款機(jī)器人,硬件和軟件技術(shù)如何更好地融合是關(guān)鍵性問題。那么,從開發(fā)程序上來看,到底是有了硬件再去開發(fā)軟件,還是二者能同時(shí)進(jìn)行?
趙明國認(rèn)為,機(jī)器人運(yùn)動(dòng)一定要先有良好的平臺(tái),所以落地的順序應(yīng)該是齊頭并進(jìn),既要實(shí)現(xiàn)大型的伺服舵機(jī)商業(yè)化,另外相應(yīng)的軟件也要同步發(fā)展。但是一開始一定要把伺服舵機(jī)落實(shí)下來。
此外,陶大程也對(duì)記者表示,自己從事深度學(xué)習(xí)已經(jīng)很長時(shí)間了,深度學(xué)習(xí)的弱點(diǎn)是在沒有大量數(shù)據(jù)進(jìn)行訓(xùn)練的時(shí)候,效果可能不會(huì)太好。比如說,在座的男士都是短頭發(fā),女士都是長頭發(fā),但我出去不能說長頭發(fā)都是女的,短頭發(fā)都是男的。
他認(rèn)為,人類對(duì)大腦的理解還是非常粗淺的,深度學(xué)習(xí)實(shí)際上也沿襲了層級(jí)結(jié)構(gòu)。我們已經(jīng)看到了突破性的成果,但還是有一個(gè)過程,就像我們不能教5歲的小朋友微積分一樣,需要漸進(jìn)式地推進(jìn)。
另外,陶大程也指出,深度學(xué)習(xí)是一個(gè)潮流,但是并不代表應(yīng)該放棄原始的學(xué)習(xí)。統(tǒng)計(jì)學(xué)習(xí)和深度學(xué)習(xí)未來必將有機(jī)地結(jié)合在一起,解決我們的需求。