Siri不夠聰明,再給它一雙眼吧!CMU與蘋果合作,攝像頭讓AI助手更精確
你也向往科幻片里的語音助手嗎?比如托尼家的Jarvis、Friday,引得眾多漫威迷的羨慕,它們不止是語音助手,簡(jiǎn)直可以說是智能管家!從生活起居到組裝鋼鐵戰(zhàn)衣再到研究敵人裝備,可以說是無所不能。
再看看自己手機(jī)里的語音助手,只能通過它調(diào)用一些基本功能,更不可能跳出手機(jī)跟主人在現(xiàn)實(shí)中互動(dòng)。
然而,近期卡內(nèi)基梅隆大學(xué)人機(jī)交互研究所的研究人員設(shè)計(jì)了一款名叫“WorldGaze”的iOS程序,似乎可以將手機(jī)中的AI語音助手帶到現(xiàn)實(shí)中來,進(jìn)一步融入我們的生活。
AI語音助手跳出屏幕,走進(jìn)現(xiàn)實(shí)!
這個(gè)AI系統(tǒng)可以同時(shí)調(diào)用智能手機(jī)的前后攝像頭,通過前置攝像頭在現(xiàn)實(shí)空間中定位用戶的頭部,而后置攝像頭可以實(shí)時(shí)觀察用戶周圍的場(chǎng)景,并利用計(jì)算機(jī)視覺技術(shù)解析識(shí)別附近的物體。
當(dāng)你走在路上時(shí),AI可以將你的頭部和眼睛作為指針,當(dāng)你將視線轉(zhuǎn)向路上的任何建筑或物體時(shí),AI也可以隨之檢測(cè)到。
不僅如此,AI還能掌握這些建筑或物體的信息,甚至當(dāng)你看到路邊的星巴克時(shí)可以問它,“星巴克什么時(shí)候關(guān)門?”
又或者當(dāng)你走進(jìn)一家零售店,問它“那款沙發(fā)還有其他顏色可以選擇嗎?”,“這把椅子和那把椅子哪個(gè)更便宜?”它都可以解答你的疑問,隨時(shí)與你互動(dòng)。
回到家中,AI語音助手還可以與你的智能家居網(wǎng)絡(luò)進(jìn)行互聯(lián),你可以遠(yuǎn)程控制各種設(shè)備,例如你看向電視并對(duì)語音助手說“打開它”,電視就能打開,而無需說出家具名稱。這款語音助手可以結(jié)合你的視線和語音,簡(jiǎn)化操作語音指令。
這款A(yù)I語音助手未來有望應(yīng)用到AR眼鏡上
該AI語音助手的研究人員Chris Harrison稱,希望這項(xiàng)技術(shù)能夠有助于“社交化移動(dòng)AR體驗(yàn)”,讓人們變成“抬頭族”,而不再是走在路上低頭刷手機(jī)。
愿望是美好的,然而現(xiàn)在的技術(shù)還存在一定的局限性。比如,AI需要通過手機(jī)后置攝像頭拍攝來檢測(cè)物體,然而用戶一直舉著手機(jī)并不方便,也難免會(huì)有些尷尬。
或許像智能眼鏡之類的設(shè)備才是更適合這種AI語音助手的載體。Harrison也證實(shí),該軟件可以輕松地應(yīng)用在AR眼鏡上。
Harrison還稱,“兩種可能性都有,”他們目前選擇專注于智能手機(jī),只是因?yàn)楝F(xiàn)階段手機(jī)已經(jīng)成為了每個(gè)人的必需品,而目前幾乎沒有人戴AR眼鏡。
他補(bǔ)充道,“AR眼鏡越來越多地加入了追蹤注視位置的傳感器(比如Magic Leap,它用于對(duì)焦),所以在這種情況下,人們只需要一個(gè)向外的攝像頭就可以了?!?/p>
如果這項(xiàng)黑科技再向前邁進(jìn)一步又可以做到什么?
會(huì)不會(huì)就越來越像科幻片中的場(chǎng)景,當(dāng)我們走在路上,戴著眼鏡,看向一位路人,問“那是誰?”,語音助手在短短幾秒內(nèi)調(diào)取了這個(gè)人的資料讀給你。
當(dāng)然,這還只是開發(fā)人員一個(gè)大膽的猜想,因?yàn)橐胂到y(tǒng)與面部識(shí)別技術(shù)相結(jié)合,那么必須要得到人臉信息相關(guān)數(shù)據(jù)庫(kù)的合法授權(quán)。
隨著科技的進(jìn)步,科技所面臨的社會(huì)爭(zhēng)議也愈發(fā)強(qiáng)烈,當(dāng)開發(fā)人員被問及這種可能性時(shí),Harrison表示,“必須要得到許可,還需要具備一定程度的安全性,這不是我們目前正在考慮的事情,但這是一個(gè)有趣的,也可能是一個(gè)可怕的想法?!?/p>