IBM 送給 AI 開(kāi)發(fā)者的禮物:傻萌的入門(mén)級(jí) Watson 機(jī)器人
Watson 開(kāi)發(fā)者大會(huì)上,IBM 發(fā)布了 TJBot ——能組裝出上圖所示紙板機(jī)器人的 DIY 工具組合??刹灰?yàn)樯得取⒑?jiǎn)陋的外表小看它,它本質(zhì)上是基于 Watson 的可編程 AI 。早在發(fā)布紙箱版本之前,遍布全球的開(kāi)發(fā)者就已創(chuàng)造出激光切割和 3D 打印的 TJBot:包括南非、肯尼亞、意大利、德國(guó)、瑞士、巴基斯坦、加拿大和香港。多個(gè)開(kāi)發(fā)者團(tuán)隊(duì)表示有興趣與 IBM 合作,為 TJBot 設(shè)計(jì)新的使用場(chǎng)景:從用于機(jī)器人/認(rèn)知課程的教學(xué),到關(guān)懷老年人、開(kāi)發(fā)談話代理的企業(yè)級(jí)解決方案。
IBM 發(fā)布的如何制作 TJBot、如何對(duì) 它編程的指令集(被稱為“菜單”),在 Instructables 在線開(kāi)發(fā)者社區(qū)廣受好評(píng)。該項(xiàng)目在社區(qū)主要頁(yè)面都有體現(xiàn),并已收到 21000 份用戶評(píng)論。TJBot 被各種層次的開(kāi)發(fā)者所接受,從初學(xué)者到專(zhuān)家。大家用它來(lái)創(chuàng)建能學(xué)習(xí)、推理、與人自然交互的認(rèn)知對(duì)象。
簡(jiǎn)化設(shè)計(jì)——為開(kāi)發(fā)者而開(kāi)發(fā)
TJBot 項(xiàng)目的初衷,是成為用戶體驗(yàn)和試驗(yàn)“具象化認(rèn)知”的入門(mén)素材。“具象化認(rèn)知”是指把 AI 技術(shù)植入到它已經(jīng)在與之交互的設(shè)備、物體、空間里。如果這個(gè)過(guò)程足夠簡(jiǎn)單,用戶們會(huì)創(chuàng)造出什么來(lái)呢?會(huì)產(chǎn)生什么樣的設(shè)計(jì)思路?TJBot 幫助尋找這些問(wèn)題的答案。作為大家都買(mǎi)得起的 DIY 工具,它把“具象化認(rèn)知”的創(chuàng)新過(guò)程民主化。
為了這一目標(biāo), TJBot 項(xiàng)目的一個(gè)指導(dǎo)原則是“簡(jiǎn)單”。這在硬件零件,和編程語(yǔ)言平臺(tái)的選擇上得到體現(xiàn)。從最基本的原型機(jī)工具入手,IBM 測(cè)試了各種 LED,麥克風(fēng)、揚(yáng)聲器和伺服電機(jī);最后選擇出小巧、功能多樣但又容易上手的模型。同樣地,控制這些傳感器的軟件使用 Nodejs 編寫(xiě),它是一個(gè)用 JavaScript 開(kāi)發(fā)軟件應(yīng)用的開(kāi)源、跨平臺(tái)的運(yùn)行環(huán)境。
借助傳感器和 Watson 實(shí)現(xiàn)多種功能:
作為原型機(jī),TJBot 的技能樹(shù)正在不斷擴(kuò)展:它現(xiàn)在已經(jīng)能說(shuō)話、進(jìn)行語(yǔ)音識(shí)別、揮手和跳舞。這些能力由它內(nèi)置的傳感器、以及一系列認(rèn)知服務(wù)來(lái)實(shí)現(xiàn)。比如,TJBot 的說(shuō)話功能由 Watson 文字到語(yǔ)音服務(wù)在軟件層面完成,然后通過(guò)揚(yáng)聲器播放出來(lái)。同樣的, Watson 語(yǔ)音到文字服務(wù),以及 TJBot 的麥克風(fēng),組合起來(lái)使它能進(jìn)行語(yǔ)音識(shí)別。這些技能可以被進(jìn)一步組合,創(chuàng)造出新的應(yīng)用場(chǎng)景,比如說(shuō)創(chuàng)建虛擬代理或者數(shù)字助手。
新增加菜單
目前,TJBot 在 Github 的工具庫(kù)包含三個(gè)基本“菜單”:讓 TJBot 對(duì)簡(jiǎn)單語(yǔ)音命令做出回應(yīng)的代碼,分析推文的情緒并回復(fù),還有讓 TJBot 作為談話代理。社區(qū)的開(kāi)發(fā)者們由為它加入了兩個(gè)菜單:TJWave 和 Swifty TJ。TJwave 很有趣,它展示給開(kāi)發(fā)者如何控制 TJBot 的手臂。它還包含額外功能:讓 TJBot 隨音樂(lè)“起舞”:TJBot 會(huì)播放一段音樂(lè)文件,提取其中的節(jié)拍和峰值,然后隨之揮手??刂?TJBot 的小短手還能用來(lái)使語(yǔ)音交互更生動(dòng),以及模仿人類(lèi)說(shuō)話時(shí)的手部動(dòng)作。Swifty TJ 展示了如何用 Swift 語(yǔ)言控制 TJBot 上的 LED。隨著 TJBot 的菜單目錄不斷擴(kuò)大,Swifty TJ 為 Swift 開(kāi)發(fā)者給 TJBot 寫(xiě)代碼提供了出發(fā)點(diǎn)。
下一步
2017 年,IBM 將專(zhuān)注于在三個(gè)領(lǐng)域提升 TJBot:開(kāi)發(fā),維護(hù)和學(xué)習(xí)。
開(kāi)發(fā):IBM 會(huì)不斷對(duì)現(xiàn)有菜單進(jìn)行改進(jìn),同時(shí)探索紙板機(jī)器人的新技能。一個(gè)例子是:IBM 剛剛利用 TJBot 的攝像頭傳感器(配合相關(guān)軟件應(yīng)用)實(shí)現(xiàn)了它的視覺(jué)識(shí)別能力。
維護(hù):發(fā)展并維護(hù) TJBot 開(kāi)發(fā)者社區(qū),把 TJBot 介紹給新用戶,分享新菜單、用戶難題和反饋。
學(xué)習(xí):或許,這是下一步最重要的事。這包含對(duì)開(kāi)發(fā)者使用體驗(yàn)、終端用戶使用體驗(yàn)的調(diào)查研究,以提供更好的設(shè)計(jì)思路和對(duì)認(rèn)知應(yīng)用的設(shè)計(jì)指導(dǎo)。