IBM嵌入式語音識別技術(shù)無需預(yù)先存儲特殊指令
ibm日前發(fā)布了其嵌入式viavoice4.4軟件包,其中采用了任意指令識別和一種創(chuàng)新的語音識別技術(shù),該技術(shù)容許駕駛員和手持設(shè)備用戶以自然語音發(fā)出指令,而不必存儲特殊的預(yù)定指令。
ibm的嵌入式viavoice4.4為移動設(shè)備--例如車載導(dǎo)航系統(tǒng)、免提電話、pda和其它智能設(shè)備提供了較為領(lǐng)先的語音技術(shù)。嵌入式設(shè)備采用ibm語音識別技術(shù)的應(yīng)用主要有兩種:1.自動語音識別應(yīng)用:利用人類的語音將輸入指令錄入移動設(shè)備的;2.文字-語音轉(zhuǎn)換設(shè)備:將文字和來自某種移動設(shè)備的信息用合成的人類聲音讀出來。
新產(chǎn)品的設(shè)計(jì)為用戶提供了新的靈活性并提高了嵌入式語音設(shè)備的識別精度。例如,對于“收音機(jī)104.3fm”這個指令,采用ibm的新技術(shù)就容許駕駛員發(fā)出“調(diào)到104.3”或“將收音臺調(diào)到104.3”或“將收音臺變到104.3”。采用各種直覺指令就可以把收音臺調(diào)到期望的信道,因而就不必記憶特殊的指令表。
ibm的嵌入式viavoice4.4具有任意指令識別的功能,它采用統(tǒng)計(jì)語言建模和語義解釋技術(shù),讓語音識別系統(tǒng)能夠聽懂用戶的自然語音。任意指令識別技術(shù)容許人們在車載收音機(jī)、導(dǎo)航系統(tǒng)或手持設(shè)備的語音指令控制中采用未經(jīng)控制設(shè)備存儲的直覺指令組。
在新的軟件包中,通過采用新的聲學(xué)模型、增強(qiáng)的聲學(xué)模型訓(xùn)練技術(shù)和經(jīng)改進(jìn)的語音靜默檢測方法,改進(jìn)了噪聲條件下的總體識別精度。該功能對于處理道路顛簸、按喇叭或鐵路道口噪聲環(huán)境的指令識別很有效。
ibm表示,該產(chǎn)品“開箱即用”,新用戶可方便地操作系統(tǒng),駕駛員因再也不必記憶特殊字或詞組而可把注意力集中在安全駕駛上。手持設(shè)備用戶可以在正常地進(jìn)行其它行為的同時流暢地執(zhí)行各種手持設(shè)備功能。新系統(tǒng)不僅容許任意指令識別,而且可以識別多種語言的指令。