1.語音識別概述
語音識別技術(shù),AutomaTIc Speech RecogniTIon,簡稱ASR,是一種讓機器聽懂人類語言的技術(shù)。語言是人類進行信息交流的最主要、最長用、最直接的方式。語音識別技術(shù)是實現(xiàn)人機對話的一項重大突破,在國外近年來發(fā)展十分迅速,其應(yīng)用也逐步得到推廣。近幾年逐漸普及的IVR(自動電話應(yīng)答)處理了不少簡單而又重復(fù)的咨詢工作,節(jié)省了不少人力,但這種按鍵式的語音自動應(yīng)答卻讓客戶花費很多時間按指引來完成簡單的查詢,令用戶倍感不便。
語音識別無疑可以解決該方面的問題。語音識別系統(tǒng)的開發(fā)成功,充分發(fā)揮了計算機技術(shù)和網(wǎng)絡(luò)技術(shù)的優(yōu)勢,采用先進的人機對話方式,擺脫電話按鍵的束縛,人們只要象平常一樣對著電話簡單的說出所需服務(wù)項目,即可輕松獲取自動系統(tǒng)提供的所需信息。
語音識別系統(tǒng)結(jié)構(gòu)
2.語音識別應(yīng)用
Nuance公司是自然語音接口軟件的佼佼者。使用自然語音接口軟件,人們可以通過電話方便安全地獲取信息、服務(wù)并進行交易。每天,千千萬萬的人通過撥打運行Nuance公司語音識別、語言理解和聲紋鑒別軟件的電話,進行出游預(yù)訂、股票交易、與其它通訊媒體、企業(yè)和互聯(lián)網(wǎng)系統(tǒng)進行交往等活動。NUANCE的應(yīng)用:美國航空、Bell AtlanTIc、Charles Schwab、家庭購物網(wǎng)絡(luò)、Lloyds TSB、Sears、UPS 。
3.NUANCE語音識別特點
(1)海量詞匯、獨立于講話者的健壯識別功能
Nuance系統(tǒng)能可靠地對多種語言進行大詞匯量的識別,并可提供識別結(jié)果的置信度。該系統(tǒng)對商業(yè)上使用的大量詞匯提供最準確的語音識別技術(shù)。利用Nuance系統(tǒng)開發(fā)的應(yīng)用程序,在市場上具有最高的準確率。生產(chǎn)中的應(yīng)用程序經(jīng)測試,準確性超過96%。
(2)基于主機的客戶/服務(wù)機結(jié)構(gòu)
Nuance系統(tǒng)基于開放式客戶/服務(wù)機結(jié)構(gòu),特別為大型應(yīng)用程序所需的健壯性和可伸縮性而設(shè)計。呼叫者的講話由客戶端收集,而識別和鑒別處理的負載被平均分配到網(wǎng)絡(luò)上的多個分開的服務(wù)器上。
?。?)N-Best處理
對于有些應(yīng)用程序,可能需要識別引擎產(chǎn)生可能的識別結(jié)果集,而不是一個最好的結(jié)果。Nuance系統(tǒng)的N-best識別處理方法便有這個功能,它提供了可能的識別結(jié)果列表,并按可能性從高到低排列。
?。?)語法概率
Nuance系統(tǒng)允許對呼叫者所講的特定詞語或短語的在語法中的概率進行指定。當被講的詞語或短語的概率可根據(jù)實際使用進行估計時,非常有用。對語法增加概率可提高識別的準確率和速度。
?。?)降低噪音
當進來的呼叫包含穩(wěn)定的背景噪音時,Nuance系統(tǒng)通過一種機制,使識別服務(wù)器更準確地進行識別。識別服務(wù)器將進來的話語進行增強,以有效地將語氣、嗡嗡聲、哼叫聲、噓噓聲等噪聲過濾。如果相當數(shù)量的電話均含有穩(wěn)定的背景噪聲,比如在汽車上免提打電話時,這個機制效果較理想。
4.基于識別的應(yīng)用
語音短信本身業(yè)務(wù)、公司電話簿、個人電話簿、智能點歌、股票查詢和交易、智能信息點播、列車時刻查詢
?。?)基于語音識別的公司電話簿
公司電話薄應(yīng)用描述
系統(tǒng)能支持多個接入號碼,虛擬多個公司的總機。并依靠語音識別技術(shù),智能轉(zhuǎn)接到相應(yīng)的用戶。
流程
用戶撥打接入碼,系統(tǒng)根據(jù)接入碼找到相應(yīng)的公司數(shù)據(jù)庫,同時提醒用戶說出相應(yīng)的用戶,系統(tǒng)依據(jù)相應(yīng)的用戶查詢數(shù)據(jù)庫,并得到該用戶的號碼,并通知交換機將該號碼接通。
公司電話簿特點
•系統(tǒng)支持電話接入方式
用戶可通過電話修改個人密碼,個人上班電話和非上班電話
•系統(tǒng)支持WEB接入方式
• 系統(tǒng)管理員可修改所有信息
• 各公司管理員可增加,刪除,修改本公司的電話信息
?。?)基于語音識別的點歌功能
功能描述
用戶接入系統(tǒng),提示用戶說出歌名,并依靠語音識別技術(shù),查找到該歌名,并播放給用戶。
應(yīng)用流程
用戶撥打接入碼,提示用戶說出歌名或歌手名,并依靠語音識別技術(shù),查找到該歌名或歌手名,若為歌名查詢數(shù)據(jù)庫,得到該歌存儲的路徑,并播放給用戶,若為歌手名,則讀出該歌手的專輯,并提醒用戶選擇,用戶選擇后,讀出該專輯的歌名,并提醒用戶選擇,用戶選擇后,給用戶播放該歌曲。