未來,當(dāng)你在跟其他人談話時,可能要格外小心,因為有些人可能正在窗外旁聽。近期,來自Adobe、微軟和麻省理工大學(xué)研究團(tuán)隊開發(fā)出了一種視覺麥克風(fēng)算法,它可以通過分析視頻錄像片段中的微小振動來“提取”音頻。
這項研究利用了數(shù)碼相機(jī)中的“果凍現(xiàn)象”(即感應(yīng)器能夠一次性讀出一排像素),從而監(jiān)測出與聲音相關(guān)的運動。在此過程中,你所需要的僅僅是一款可以以高頻幀來拍攝視頻的攝像頭。
研究人員利用的就是振動產(chǎn)生聲音的原理,他們在5米之外,能夠“還原”一袋薯片振動時聲音。該研究小組成員Abe Davis表示:“當(dāng)物體發(fā)聲時,會產(chǎn)生振動,而振動又會產(chǎn)生一種輕微的信號,這種信號肉眼無法看到,但通過系統(tǒng)分析就可以識別出來。”
不過,現(xiàn)在你還不必過分擔(dān)憂被“竊聽”,因為這項研究目前所使用的專業(yè)攝像機(jī)還只能識別人的語言,但還不能確認(rèn)出具體說的內(nèi)容。不過,假如這項技術(shù)成熟,它最有可能應(yīng)用在偵探領(lǐng)域,調(diào)查員無需與嫌疑犯通話,也能知道后者在說什么。
Abe Davis表示,視覺麥克風(fēng)算法無需接觸就能識別出物體的“特性”。如果真是這樣,這將是一項非常有用的技術(shù)。