東京大學(xué)和索尼共同研發(fā)出AI系統(tǒng)“Derma” 可實(shí)現(xiàn)從口形到語音的轉(zhuǎn)化
不出聲,僅僅通過喉嚨和下顎的皮膚震動就能知道你想說什么。這可不是讀唇術(shù),更不是在拍特工電影。
據(jù)外媒報道,近日,東京大學(xué)和索尼計算機(jī)科學(xué)研究所共同研發(fā)出的AI系統(tǒng)“Derma”,通過將傳感器貼合在喉嚨周圍的皮膚上,就能成功實(shí)現(xiàn)從口形(無聲說話)到語音的轉(zhuǎn)化。
據(jù)了解,該設(shè)備的研究靈感來源于視聽障礙者的觸診唇讀法,研究者們利用機(jī)器學(xué)習(xí)把整個過程自動化,完成了深層學(xué)習(xí)的無聲語音交互。
該設(shè)備只要在下顎皮膚的兩個位置安裝加速度計和角速度傳感器,輔之機(jī)器學(xué)習(xí),就能通過隨著說話發(fā)生的下顎運(yùn)動和舌肌運(yùn)動引起的從下顎到喉嚨的皮膚顫動,進(jìn)行無聲的“語音識別”。
目前,研究者從傳感器上獲取到了12維皮膚運(yùn)動信息,能夠分析識別35種發(fā)聲命令短語,準(zhǔn)確率達(dá)到了94%以上。
該設(shè)備體積小、重量輕、耗電量低,不易受到照明條件等周圍環(huán)境因素的影響。在生活中,該設(shè)備也不會影響到使用者的正常生活,吃飯和日常的交流可以照常進(jìn)行,非常實(shí)用。
未來,相信這個設(shè)備能夠造福大批殘障人士。