真正偉大的創(chuàng)新,將會決定很長一段時間人類改變世界的方式,比如蒸汽機(jī)或計算機(jī),而Kinect在這一視角下,幾乎必然會成為一種關(guān)鍵力量。
微軟公司首席研究官里克·雷斯特安靜地坐在記者面前,溫文爾雅,與他實際的身份相比,看起來更像是一個在大學(xué)呆了許久的教授。開始采訪后,沒想到我們第一個話題并不是關(guān)于微軟,也不是關(guān)于計算機(jī)或互聯(lián)網(wǎng),而是蒸汽機(jī)。
整個社會每隔幾十年或上百年,就會出現(xiàn)一次比較大的創(chuàng)新,可是這樣的創(chuàng)新會給世界帶來多大的影響呢?“你要了解這一點,最好的方法是去倫敦的大英科學(xué)博物館參觀,去看看里面那些個頭巨大的蒸汽機(jī)展品。”里克說。
16世紀(jì)到17世紀(jì),蒸汽機(jī)的出現(xiàn)和不斷改良對英國社會和全世界產(chǎn)生了巨大的影響。曾幾何時,蒸汽機(jī)是一切問題的答案——無論你想建造任何事物,或者開展任何工程,都可以通過設(shè)計,讓蒸汽機(jī)來完成。
這是真正偉大創(chuàng)新的力量,它決定了之后很長一段時間人類改變世界的方法。而我們現(xiàn)在正在經(jīng)歷的或許與之相仿,只不過不是由蒸汽機(jī)、而是計算機(jī)所驅(qū)動的創(chuàng)新時代。如果說蒸汽機(jī)決定了人們改造和創(chuàng)造世界的方法,則計算機(jī)更多地為人類觀察和了解世界提供了一種方法論,從廣袤的宇宙到微小的細(xì)胞,乃至人與人的組織形態(tài)。
如果說人的進(jìn)化在于對工具使用的不斷升級,則我們正在面臨一個工具再次革新的時代。在這樣的背景下,Kinect正在通過對人機(jī)交互的改變,提供一種關(guān)鍵力量。
Kinect超現(xiàn)實世界
恰逢微軟研究院20周年,記者有機(jī)會在西雅圖參加了“微軟技術(shù)節(jié)”(TechFest)的公開部分。雖然不能獲知各種技術(shù)將如何與產(chǎn)品結(jié)合的進(jìn)一步細(xì)節(jié),但所看到的技術(shù)已經(jīng)讓人大為驚訝。走進(jìn)展廳,密密麻麻的技術(shù)展示讓人仿佛置身于科幻世界,其中大部分技術(shù)已經(jīng)有了相當(dāng)強(qiáng)的應(yīng)用場景展示——如果它們真能應(yīng)用到現(xiàn)實社會中,無疑將刮起一陣科技風(fēng)暴。
Chris Harrison站在那里,他左邊肩膀上放著一個奇怪的裝置,那是一個微型Kinect和投影儀的組合。這個來自微軟雷德蒙研究院的小伙子笑了笑,向前伸出了自己的左手,只見一片光打下,手中出現(xiàn)了一個Windows Phone的投影。
可這不只是投影而已,他用右手開始點擊投影出的手機(jī),一切開始運轉(zhuǎn),這個虛擬手機(jī)用起來和真實的手機(jī)一模一樣。他嘗試打了個電話,又打開相簿,偏了偏肩膀,圖片開始在墻上更大的區(qū)域展示。
這玩意兒有個一看就懂的名字,“可穿著的多點觸控交互”,是他正在研究的技術(shù),能在生活中常見的表面上實現(xiàn)交互式多點觸控應(yīng)用。它不需要任何校準(zhǔn)就可以提供類似鼠標(biāo)或觸摸屏的功能,不止如此,還能輕易識別手指在懸空狀態(tài)下的指令,與2D的觸摸屏相比,變成了一個“觸摸空間”。
看似簡單的搭配:Kinect識別動作、投影儀展示、用云計算處理信息,卻產(chǎn)生了遠(yuǎn)遠(yuǎn)超過現(xiàn)有觸摸交互的效果。通過距離判定,它還能進(jìn)行身份判定,只識別使用者手指所進(jìn)行的操作。想想看,與現(xiàn)在帶個手機(jī)或平板相比,未來每個人可能只需要攜帶一個巴掌大小的裝備就夠了。
比這個更有趣的是Harrison的同事Hrvoje Benko所展示的Beamatron技術(shù)。他手拿一個像玩具汽車操縱桿的玩意兒,在地上控制一輛投影出來的虛擬汽車。汽車在現(xiàn)實中的房間地板上行駛,碰到斜坡或墻壁,還能自己上下坡和遇到碰撞時產(chǎn)生反應(yīng),和一輛真正的玩具車差不了多少。
它的實現(xiàn)原理和之前類似,可應(yīng)用的場景嚴(yán)格來說歸于“增強(qiáng)現(xiàn)實”類,實現(xiàn)了相當(dāng)有趣的虛擬圖層和現(xiàn)實的交互,并能根據(jù)指令產(chǎn)生不同的反饋。讓虛擬的人或物在一片現(xiàn)實的障礙中穿行,這提供了很大的想象空間,不只是在未來的娛樂領(lǐng)域。比如,根據(jù)人在客廳里的行動,自動把他所收到的新郵件或者新短信放到他的視野范圍內(nèi),這樣就不會錯過任何一個信息了。
幾乎每一個技術(shù)都能引發(fā)無盡的想象。在一個角落的展臺上,記者看到了一副真實的“機(jī)器人之眼”。它由兩個Kinect所組成,模仿人的眼睛向外觀察事物,并且遠(yuǎn)程連接到用戶面前。你的面前會展現(xiàn)出機(jī)器眼睛所看到的場景,它是3D的,并且會隨著你頭的轉(zhuǎn)動來調(diào)換場景。這可真是“足不出戶知天下”了。
而在它不遠(yuǎn)處,有個名為IllumiShare的分享技術(shù),很多人圍繞在它周圍。這是個看起來像臺燈的裝置,它提供了一個共享的方形平臺,利用Kinect的捕捉能力,能讓身處不同空間的兩個人在同一個平臺上畫畫或展示物品,效果相當(dāng)驚人。據(jù)技術(shù)研究者、來自微軟印度研究院的Sasa Junuzovic介紹,要實現(xiàn)這樣的效果成本并不高,商用起來很方便。
這一切讓人眼花繚亂。事實上現(xiàn)場還有很多很酷的技術(shù),幾乎所有最熱的名詞如增強(qiáng)現(xiàn)實、裸眼3D、動態(tài)捕捉、近場交互、實時翻譯,都能在這里找到正在不斷研究且進(jìn)展很快的技術(shù)真身,比如當(dāng)你口述一段中文,機(jī)器自動將它變成和你口音一模一樣的意大利語;又或者你能用手指非常簡單地取代鼠標(biāo),精確在空中完成對電腦的操作。
但其中最耀眼的明星仍是Kinect。這個已經(jīng)在微軟Xbox游戲機(jī)中得以商用的、價格低廉的裝置正在引爆更大的想象空間,并激發(fā)了微軟全球各個研究院中技術(shù)開發(fā)者們?nèi)ヒ运鼮榛A(chǔ)實現(xiàn)更深層、更具體的技術(shù)創(chuàng)新。記者詢問了許多新技術(shù)的開始時間,它們很大一部分都是開始于近兩三年內(nèi),那正是Kinect在游戲玩家中最初流行的時候。
其實,Kinect本身的實現(xiàn)原理并沒有那么復(fù)雜,但它成功地用一種更自然的方式實現(xiàn)了對現(xiàn)實世界中尤其是人的動作捕捉。其意義在于,它讓計算機(jī)有了更準(zhǔn)確有效的“眼睛”去觀察這個世界,并根據(jù)人的動作來完成各種指令。
方腦袋的機(jī)器人
“我覺得我們已經(jīng)進(jìn)入了這樣一個時代:計算機(jī)漸漸擁有了能夠與人類相媲美的能力——它們能看到、聽到、觸摸、感覺、了解我們所處的地點和感知運動狀態(tài)。我們逐漸賦予了計算機(jī)這些能力,并用它開辟出巨大的用武之地。”里克說,“我們已經(jīng)取得了不錯的進(jìn)展,比如Kinect這種相對廉價的裝置,能看到你的運動并識別動作,并利用這些信息來控制用戶界面。”
有意思的是,即便在技術(shù)研究界,大家也對Kinect如此管用感到很意外和驚訝,它開創(chuàng)了一個全新的研究領(lǐng)域,所有人都會想:“我們可以用Kinect來干點別的什么呢?”
而微軟做的事情是順?biāo)浦?。在不久之前,微軟發(fā)布了Kinect的Windows SDK套件,允許全世界對此有興趣的人基于Windows操作系統(tǒng)來挖掘Kinect的可能性,目前其下載量已經(jīng)十分巨大。還記得Kinect剛發(fā)布時的標(biāo)語,“身體就是控制器”,很多初創(chuàng)企業(yè)在這種新的人機(jī)交互方式中發(fā)現(xiàn)了蘊(yùn)藏的機(jī)會。
微軟研究院自己自然首當(dāng)其沖。里克舉了一個例子,當(dāng)醫(yī)生在做手術(shù)時,他很多時候需要查詢關(guān)于病人的信息,比如在動作空間很小的血管手術(shù)里查看關(guān)鍵脈絡(luò),可他們因為衛(wèi)生原因,又無法在手術(shù)狀態(tài)下用任何觸摸來完成信息的檢索。而現(xiàn)在利用Kinect,醫(yī)生完全可以實現(xiàn)這一點。
在人眼無法看到東西的暗處,Kinect也有妙用。它能通過紅外攝像頭“看到”事物,并且根據(jù)人的動作,經(jīng)由不同聲音的播放來對人進(jìn)行提醒。這種方式對盲人格外有效。
在卡內(nèi)基梅隆大學(xué),人們正在用Kinect攝像頭來控制機(jī)器人,讓機(jī)器人自己獨立走遍新落成的計算機(jī)系大樓。機(jī)器人能看到來往的人并及時避讓,還會道歉。機(jī)器人會使用電梯——機(jī)器人不一定會操控電梯,但是它可以等候其他人到來,并請求別人幫助它進(jìn)行相應(yīng)的操作。據(jù)說這臺機(jī)器人行動很快,不像傳統(tǒng)大家看到的機(jī)器人那么緩緩挪動。
里克最近還看到一項演示,一家公司正在研究如何將Kinect攝像頭用在超市購物車上,這樣購物車就可以自動地跟隨人們逛店購物。把商品放進(jìn)購物車時,它會自動通過攝像頭掃描,知道你所購買的是什么,并且在整個購物過程中提供協(xié)助。
Kinect與計算機(jī)的未來
正如無數(shù)科幻影片里所看到的,“機(jī)器人時代”正在到來,只不過它并非以擬人的方式存在,而是以計算機(jī)的形態(tài)出現(xiàn)在人們周圍。它們通過攝像頭來“看”,通過麥克風(fēng)來“聽”,一連串的語音分析技術(shù)和算法正在讓它聽得更智能;還有觸摸和了解,微軟等公司的大數(shù)據(jù)計算分析技術(shù)正在為“機(jī)器人”構(gòu)建越來越智慧和豐富的“大腦”。
而Kinect正是讓“機(jī)器人”的眼睛升級的過程,由此激發(fā)的各種應(yīng)用場景下的創(chuàng)新,則是由眼睛連接到“大腦”并給予反饋的方式。
“這雙眼睛”本身也在不斷完善。微軟亞洲研究院的趙春水和顧嘉唯為記者演示了“支持手勢識別的下一代網(wǎng)絡(luò)攝像頭”,這簡直就是一個活生生的最適合PC電腦場景下的寶貝。
與Kinect相比,它距離更近、實現(xiàn)更精確、視野更廣,能夠捕捉“雙目”立體視頻和高精度圖像,比如人臉的細(xì)節(jié)甚至是指紋。這意味著什么?我們可以用比《少數(shù)派報告》中湯姆·克魯斯更酷的方式來操控我們的信息,我們可以用更個性化的指紋或面部識別方式來管理我們的身份,甚至還有與過去“鼠標(biāo)+鍵盤”時代完全不同的使用軟件和互聯(lián)網(wǎng)的方式。
未來,你很有可能只需要做一個打響指的動作就開啟QQ,或者翹起大拇指來刷新微博。與很多行業(yè)應(yīng)用相比,這股Kinect引發(fā)的創(chuàng)新潮流將會在未來10年對大眾與社會產(chǎn)生深刻的影響。
“回頭看70年前,有些體力勞動是非常艱難的。我看過一篇20世紀(jì)20年代的文章,當(dāng)時的人們盼望著結(jié)束每天工作16小時的生活。人們的工作時間很長、強(qiáng)度很大,壽命卻很短。”里克說,“現(xiàn)在人們有越來越多閑暇時間,能夠以更高效率完成工作,并且還有更多自我實現(xiàn)的機(jī)會。我想如果沒有計算機(jī),很多事情不會如此變好。”
通過Kinect,我們看到了在人類改變世界中更大的可能性,與此同時,計算機(jī)逐漸可以被人以一種更加簡單的方式去使用與控制。未來可能再也不用學(xué)輸入法、編程甚至是外語,我們天生就可以和任何計算機(jī)、任何人對話,以我們最自然的方式。