設(shè)計(jì)并實(shí)現(xiàn)了一種基于定點(diǎn)數(shù)字信號(hào)處理器(DSP)的語(yǔ)音識(shí)別與控制系統(tǒng)。由音頻編解碼芯片(TLV320AIC23)負(fù)責(zé)采集語(yǔ)音信號(hào);以定點(diǎn)DSP(TMS320VC5509A)作為運(yùn)算處理單元;通過(guò)定點(diǎn)運(yùn)算與浮點(diǎn)運(yùn)算的有機(jī)結(jié)合,解決了處理速度與處理精度之間的矛盾;在保證處理速度的前提下,提高了運(yùn)算精度和識(shí)別率。
隨著DSP技術(shù)的進(jìn)步,計(jì)算能力更強(qiáng)、功耗更低和體積更小的DSP已經(jīng)出現(xiàn),使3G手機(jī)上植入更精確更復(fù)雜的自動(dòng)語(yǔ)音識(shí)別(ASR)功能成為可能。目前,基本ASR應(yīng)用可以分成三大類:1. 語(yǔ)音-文本轉(zhuǎn)換(語(yǔ)音輸入);2. 講者識(shí)別;3. 語(yǔ)音命令控制(語(yǔ)音控制)。 這三類功能包含了3G所需的眾多ASR性能。語(yǔ)音-文本轉(zhuǎn)換的典型實(shí)例是語(yǔ)音撥號(hào)和電子郵件聽(tīng)寫。講者識(shí)別功能可以通過(guò)語(yǔ)音識(shí)別安全地讀出存儲(chǔ)器中的個(gè)人數(shù)據(jù),從而滿足信用卡定購(gòu)和銀行服務(wù)等保密性高的應(yīng)用需要。語(yǔ)音命令控制功能包括連接語(yǔ)音擴(kuò)展標(biāo)記語(yǔ)言(VXML)網(wǎng)站內(nèi)容的語(yǔ)音接口,它支持財(cái)經(jīng)服務(wù)與目錄助理等業(yè)務(wù)。目前VXML被用于規(guī)范網(wǎng)站內(nèi)容的語(yǔ)音標(biāo)簽。
隨著DSP技術(shù)的進(jìn)步,計(jì)算能力更強(qiáng)、功耗更低和體積更小的DSP已經(jīng)出現(xiàn),使3G手機(jī)上植入更精確更復(fù)雜的自動(dòng)語(yǔ)音識(shí)別(ASR)功能成為可能。目前,基本ASR應(yīng)用可以分成三大類:1. 語(yǔ)音-文本轉(zhuǎn)換(語(yǔ)音輸入);2. 講者識(shí)別;3. 語(yǔ)音命令控制(語(yǔ)音控制)。 這三類功能包含了3G所需的眾多ASR性能。語(yǔ)音-文本轉(zhuǎn)換的典型實(shí)例是語(yǔ)音撥號(hào)和電子郵件聽(tīng)寫。講者識(shí)別功能可以通過(guò)語(yǔ)音識(shí)別安全地讀出存儲(chǔ)器中的個(gè)人數(shù)據(jù),從而滿足信用卡定購(gòu)和銀行服務(wù)等保密性高的應(yīng)用需要。語(yǔ)音命令控制功能包括連接語(yǔ)音擴(kuò)展標(biāo)記語(yǔ)言
現(xiàn)在的語(yǔ)音識(shí)別處理器集成了更多功能,它們的精確度也更高,并有更好的開(kāi)發(fā)工具支持,這使得在消費(fèi)電子產(chǎn)品中添加語(yǔ)音I/O變得相對(duì)容易。
本文從可復(fù)用和優(yōu)化芯片空間的角度出發(fā)介紹語(yǔ)音識(shí)別芯片結(jié)構(gòu)設(shè)計(jì)的種種考慮,其思路有利于開(kāi)發(fā)一系列其它語(yǔ)音識(shí)別芯片。
本文從可復(fù)用和優(yōu)化芯片空間的角度出發(fā)介紹語(yǔ)音識(shí)別芯片結(jié)構(gòu)設(shè)計(jì)的種種考慮,其思路有利于開(kāi)發(fā)一系列其它語(yǔ)音識(shí)別芯片。
本文給出了在運(yùn)用RSC-3x設(shè)計(jì)高性能的語(yǔ)音識(shí)別產(chǎn)品時(shí)應(yīng)考慮的與硬件有關(guān)的若干問(wèn)題:噪音降除、電路設(shè)計(jì)、PCB設(shè)計(jì)、麥克風(fēng)的選擇、麥克風(fēng)的安放、電源設(shè)計(jì)。
本方案主要由電話機(jī)芯片CD802加語(yǔ)音識(shí)別錄放模塊JT802構(gòu)成
凌陽(yáng)科技公司的最新產(chǎn)品SPCE061A.
凌陽(yáng)科技公司的最新產(chǎn)品SPCE061A.
國(guó)際互聯(lián)網(wǎng)聯(lián)盟(W3C)日前宣布,兩種計(jì)算機(jī)語(yǔ)音互動(dòng)規(guī)范將被列為國(guó)際標(biāo)準(zhǔn)開(kāi)始實(shí)施。一直 以來(lái),W3C都在通過(guò)多家技術(shù)企業(yè)進(jìn)行評(píng)估的基礎(chǔ)上制定自己的標(biāo)準(zhǔn)。 VoiceXML 2.0是上述標(biāo)準(zhǔn)之一,目的是要提高網(wǎng)絡(luò)內(nèi)容
香港及新加坡,2002年4月24日──在多語(yǔ)種交談式語(yǔ)音理 解技術(shù)領(lǐng)域內(nèi)首屈一指的言豐科技今日宣布,其核心語(yǔ)音識(shí)別引擎——「言豐-語(yǔ)音識(shí)別引擎」榮 膺“新加坡全國(guó)資訊通信獎(jiǎng)之最創(chuàng)新資訊通信產(chǎn)品/服務(wù)大獎(jiǎng)”。