NEC開發(fā)出在噪聲環(huán)境下進行語音操作智能機的技術(shù)
近日,通過組合噪音消除技術(shù)和語音增強技術(shù),NEC開發(fā)出了在嘈雜場所也無需緊貼智能手機或平板電腦來進行語音操作的語音識別技術(shù)。
家電及便攜終端等產(chǎn)品采用語音操作功能的越來越多,但目前還需要使內(nèi)置麥克風靠近嘴邊清楚地發(fā)音。因此,在開著電視的房間、正在做飯的廚房以及行駛中的汽車內(nèi)等有噪音的環(huán)境下,存在終端對語音沒反應(yīng)或者對噪音產(chǎn)生反應(yīng)、出現(xiàn)誤操作的問題。
而使用NEC新開發(fā)的技術(shù)后,在原本很難使用語音功能的噪音環(huán)境下,即使是離開麥克風一定距離發(fā)出的語音也能被正確檢測出來,實現(xiàn)對終端的操作。比如,能在嘈雜的客廳從距離約1m的位置操作放在桌子上的終端。此次開發(fā)的噪音消除技術(shù)和語音增強技術(shù)的概要如下。
(1)用副麥克風檢測噪音成分,準確追蹤噪音
智能手機等便攜終端大多在正面配備主麥克風,在背面或側(cè)面配備副麥克風。NEC的技術(shù)就著眼于這樣點的雙麥克風設(shè)計。采用雙麥克風設(shè)計時,容易做到讓主麥克風主要拾取語音輸入,副麥克風主要拾取噪音,因此,在主麥克風沒有語音輸入時(比如語音輸入即將開始前等),從副麥克風收集到的聲音中可明確噪音成分。這樣,在主麥克風有語音輸入時也可輕松地準確追蹤噪音,并將其去除。
?。?)使用語音模型,調(diào)整為最適于語音識別的狀態(tài)
針對去除噪音后出現(xiàn)失真而難以識別的語音,此次開發(fā)出了根據(jù)模型增強語音成分的技術(shù)。該技術(shù)可將失真的語音修正為類似波形的語音模型,使語音識別變得容易。據(jù)介紹,語音識別的精度比便攜終端語音識別的全球標準ETSI Advanced Front-End(AFE)還要高。