東京大學(xué)和索尼共同研發(fā)出AI系統(tǒng)“Derma” 可實(shí)現(xiàn)從口形到語音的轉(zhuǎn)化

時間：2020-04-28 09:45:01

關(guān)鍵字：機(jī)器學(xué)習(xí) 索尼 AI 加速度計

手機(jī)看文章

掃描二維碼
隨時隨地手機(jī)看文章

[導(dǎo)讀] 不出聲，僅僅通過喉嚨和下顎的皮膚震動就能知道你想說什么。這可不是讀唇術(shù)，更不是在拍特工電影。據(jù)外媒報道，近日，東京大學(xué)和索尼計算機(jī)科學(xué)研究所共同研發(fā)出的AI系統(tǒng)“Derma”，通過將傳

不出聲，僅僅通過喉嚨和下顎的皮膚震動就能知道你想說什么。這可不是讀唇術(shù)，更不是在拍特工電影。

據(jù)外媒報道，近日，東京大學(xué)和索尼計算機(jī)科學(xué)研究所共同研發(fā)出的AI系統(tǒng)“Derma”，通過將傳感器貼合在喉嚨周圍的皮膚上，就能成功實(shí)現(xiàn)從口形（無聲說話）到語音的轉(zhuǎn)化。

據(jù)了解，該設(shè)備的研究靈感來源于視聽障礙者的觸診唇讀法，研究者們利用機(jī)器學(xué)習(xí)把整個過程自動化，完成了深層學(xué)習(xí)的無聲語音交互。

該設(shè)備只要在下顎皮膚的兩個位置安裝加速度計和角速度傳感器，輔之機(jī)器學(xué)習(xí)，就能通過隨著說話發(fā)生的下顎運(yùn)動和舌肌運(yùn)動引起的從下顎到喉嚨的皮膚顫動，進(jìn)行無聲的“語音識別”。

目前，研究者從傳感器上獲取到了12維皮膚運(yùn)動信息，能夠分析識別35種發(fā)聲命令短語，準(zhǔn)確率達(dá)到了94%以上。

該設(shè)備體積小、重量輕、耗電量低，不易受到照明條件等周圍環(huán)境因素的影響。在生活中，該設(shè)備也不會影響到使用者的正常生活，吃飯和日常的交流可以照常進(jìn)行，非常實(shí)用。

未來，相信這個設(shè)備能夠造福大批殘障人士。

阿維塔、賽力斯已入股！華為引望可能成“中國博世”