基于TMS320VC5416DSP的數(shù)字助聽(tīng)器設(shè)計(jì)
0 引言
隨著社會(huì)的發(fā)展以及人們對(duì)聽(tīng)障患者的日益關(guān)注,助聽(tīng)器的發(fā)展逐漸受到人們的重視。但由于聽(tīng)力障礙患者病因各異,其聽(tīng)力損失情況存在著較大差異,使得每位患者對(duì)于助聽(tīng)器的補(bǔ)償有著不同的要求。目前,現(xiàn)代助聽(tīng)器技術(shù)進(jìn)入到全數(shù)字助聽(tīng)器時(shí)代。同時(shí),各種有效提高數(shù)字助聽(tīng)器效能的數(shù)字信號(hào)處理算法也得到更多的重視。在此提出基于TMS320VC5416的數(shù)字助聽(tīng)器設(shè)計(jì),能滿足聽(tīng)障患者對(duì)聽(tīng)力的需求。
l 系統(tǒng)構(gòu)成和工作原理
1.1 系統(tǒng)組成
基于助聽(tīng)器的技術(shù)要求,選用TI公司的C54X系列產(chǎn)品TMS320C5416(以下簡(jiǎn)稱C5416)和數(shù)字編碼器TLV320AIC23(以下簡(jiǎn)稱AIC23)。
數(shù)字編碼器AIC23是TI公司推出的一款高性能的立體聲音頻Codec芯片,A/D轉(zhuǎn)換和D/A轉(zhuǎn)換部件集成在芯片內(nèi)部,采用先進(jìn)的∑-△過(guò)采樣技術(shù),內(nèi)置耳機(jī)輸出放大器。AIC23 DSP Codec工作電壓與C5416的核心和I/O電壓兼容,可實(shí)現(xiàn)與C54x串行口的無(wú)縫連接,功耗很低,使得AIC23是一款非常理想的音頻模擬器件,可以很好地應(yīng)用于數(shù)字助聽(tīng)器的設(shè)計(jì)當(dāng)中。
系統(tǒng)結(jié)構(gòu)如圖1所示,主要包括DSP模塊、音頻處理模塊、JTAG接口、存儲(chǔ)模塊及電源模塊等。模擬語(yǔ)音信號(hào)通過(guò)MIC或IANE IN輸入AIC-23,經(jīng)過(guò)模/數(shù)轉(zhuǎn)換后通過(guò)MCBSP串口輸入C5416,經(jīng)過(guò)實(shí)際所需的算法進(jìn)行處理和補(bǔ)償后,得到聽(tīng)障患者所需要的語(yǔ)音信號(hào),再通過(guò)AIC23數(shù)/模轉(zhuǎn)換,通過(guò)揚(yáng)聲器或耳機(jī)輸出聲音信號(hào)。
1.2 C5416與AIC23的接口設(shè)計(jì)
圖2是C5416與AIC23的接口原理圖。由于AIC23采樣輸出的是串行數(shù)據(jù),因此需要協(xié)調(diào)好與之相配的DSP的串行傳輸協(xié)議,MCBSP是最適合做語(yǔ)音信號(hào)傳輸?shù)?。將AIC23的第22腳MODE接高電平,接收來(lái)自DSP的SPI格式串口數(shù)據(jù)。數(shù)字控制接口(SCLK,SDIN,CS)與MCBSPl連接,控制字共16位,由高位開(kāi)始傳輸。數(shù)字音頻口LRCOUT,LRCIN,DOUT,DIN,BCLK與MCBSP0相連。在工作方式上,DSP為主模式,AIC23為從模式,即BCLK的時(shí)鐘信號(hào)由DSP產(chǎn)生。
串口時(shí)鐘由BCLKX0,BCLKR0并聯(lián)到AIC23的BCLK時(shí)鐘,這樣在發(fā)送和接收數(shù)據(jù)時(shí)都可產(chǎn)生串口時(shí)鐘信號(hào)。輸入/輸出同步信號(hào)LRCIN與LRCOUT,用來(lái)啟動(dòng)串口數(shù)據(jù)傳輸,接收DSP的幀同步信號(hào)。
BFSX0和BFSR0,BDR0和BDX0分別與AIC23的DIN和DOUT連接來(lái)實(shí)現(xiàn)DSP與AIC23之間的數(shù)字通信。
2 系統(tǒng)實(shí)現(xiàn)
2.1 語(yǔ)音的基本特性
聲音是一種波,能被人耳聽(tīng)到聲音的振動(dòng)頻率為20 Hz~20 kHz。語(yǔ)音是聲音的一種,他是由人的發(fā)音器官發(fā)出的,具有一定語(yǔ)法和意義的聲音。語(yǔ)音的振動(dòng)頻率最高可達(dá)15 kHz。
語(yǔ)音按其激勵(lì)形式的不同分為:濁音、清音、爆破音。而人的聲音特性基本是由基因周期和共振峰等因素決定的。當(dāng)發(fā)濁音時(shí),氣流通過(guò)聲門(mén)使聲帶發(fā)生振動(dòng),產(chǎn)生準(zhǔn)周期激勵(lì)脈沖串。這個(gè)脈沖串的周期就稱為“基因周期”,其倒數(shù)即為“基因頻率”。
人類的聲道和鼻道都可以看做是非均勻界面的聲道管,聲道管的諧振頻率稱為共振峰。改變聲道的形狀就產(chǎn)生不同的聲音。共振峰用依次增加的多個(gè)頻率表示.如F1,F(xiàn)2,F(xiàn)3,等,稱之為第一共振峰,第二共振峰等。為了提高語(yǔ)音接收質(zhì)量,必須采用盡可能多的共振峰。實(shí)際中,頭三個(gè)共振峰是最重要的,具體情況因人而有差異。
2.2 語(yǔ)音增強(qiáng)
在實(shí)際的應(yīng)用環(huán)境中,語(yǔ)音會(huì)不同程度的受到環(huán)境噪聲的干擾。語(yǔ)音增強(qiáng)就是對(duì)帶噪語(yǔ)音進(jìn)行處理,降低噪聲的影響,改善聽(tīng)覺(jué)環(huán)境。
實(shí)際語(yǔ)音遇到的干擾可能包括以下幾類:
(1)周期性噪聲:如電器干擾,發(fā)動(dòng)機(jī)旋轉(zhuǎn)引起的干擾等,這類干擾在頻域表現(xiàn)為一些離散的窄峰。特別是50 Hz或60 Hz交流聲會(huì)引起周期噪聲。
(2)沖擊噪聲:如電火花,放電產(chǎn)生的噪聲干擾,這類干擾在時(shí)域表現(xiàn)為突然出現(xiàn)的窄脈沖。消除這種噪聲可以在時(shí)域中進(jìn)行,即根據(jù)帶噪語(yǔ)音信號(hào)幅度的平均值確定閾值。
(3)寬帶噪聲:通常指高斯噪聲或白噪聲,其特點(diǎn)是頻帶寬,幾乎覆蓋整個(gè)語(yǔ)音頻段。它的來(lái)源很多,包括風(fēng)、呼吸噪聲和一般的隨機(jī)噪聲源。
2.3 算法分析
噪聲影響使得患者語(yǔ)言識(shí)別率大幅下降,去噪和補(bǔ)償是助聽(tīng)器的重要環(huán)節(jié)。人耳對(duì)于25~22 000 Hz的聲音有反應(yīng)。語(yǔ)音的大部分可用信息只存在于200~3 500 Hz之間。根據(jù)人耳感知特性及實(shí)驗(yàn)確定,對(duì)語(yǔ)音感知,語(yǔ)音識(shí)別較為重要的第二共振峰大部分位于1 kHz之上。
2.3.1 周期噪音消除
周期噪聲一般是許多離散的譜峰,來(lái)源于發(fā)動(dòng)機(jī)的周期性運(yùn)轉(zhuǎn)。電器干擾,特別是50~60 Hz交流聲也會(huì)引起周期噪聲。所以使用帶通濾波器可以有效地消除周期噪音以及3 500 Hz以上的高頻聲音。
IIR數(shù)字濾波器在沒(méi)計(jì)上可以借助成熟的模擬濾波器的成果,如巴特沃斯、契比雪夫和橢圓濾波器等,IIR數(shù)字濾波器線性差分方程:
Matlab環(huán)境下可視化得到濾波器對(duì)動(dòng)態(tài)輸入數(shù)據(jù)的實(shí)時(shí)濾波效果如圖3所示。
2.3.2 基于短時(shí)譜估計(jì)的寬帶噪音去除
由于語(yǔ)音信號(hào)的短時(shí)譜具有較強(qiáng)相關(guān)性,而噪聲的前后相關(guān)性很弱,因此采用基于短時(shí)譜估計(jì)的方法從帶噪語(yǔ)音中估計(jì)原始語(yǔ)音。而且人耳對(duì)于語(yǔ)音相位感受不敏感,可將估計(jì)得對(duì)象放在短時(shí)譜的幅度上。
2.3.3 譜相減法
譜相減法在無(wú)參考信號(hào)源的單話筒錄音系統(tǒng)中是一個(gè)有效的方法。因?yàn)樵肼暿蔷植科椒€(wěn)的,可認(rèn)為發(fā)語(yǔ)音強(qiáng)的噪聲與發(fā)語(yǔ)音期間的噪聲功率譜相同,因此利用語(yǔ)音前后的“寂靜幀”來(lái)估計(jì)噪聲。
譜相減法的原理框圖及仿真結(jié)果如圖4,圖5所示,對(duì)語(yǔ)音信號(hào)加窗處理后,利用已知的噪聲功率譜信息對(duì)信號(hào)進(jìn)行除噪處理。
2.4 噪聲對(duì)消法
噪聲對(duì)消法是最基本的減譜算法,它的基本原理是從帶噪語(yǔ)音中直接減去噪聲。由于寬帶噪聲與語(yǔ)音信號(hào)在時(shí)域和頻域上完全重疊,是比較難去除的。所以需要用到非線性處理,自適應(yīng)濾波器不斷地調(diào)節(jié)。
圖6中一個(gè)聲道采集帶噪語(yǔ)音,另一個(gè)聲道采集噪聲。帶噪語(yǔ)音序列S(n)與噪聲序列d(n)經(jīng)傅里葉變換得到頻譜分量Sk(w)和Dk(w),噪聲分量Dk(w)經(jīng)過(guò)濾波后與帶噪語(yǔ)音相減,再加上帶噪語(yǔ)音的相位,經(jīng)傅里葉反變換恢復(fù)為時(shí)域信號(hào)。在強(qiáng)噪音背景時(shí),這種方法可以得到很好的消除噪音效果。
在實(shí)際中兩個(gè)采集聲道要保證一定隔離,以防止兩個(gè)聲道都采到帶噪語(yǔ)音。為了使采集到的噪聲更接近于帶噪語(yǔ)音中的噪聲,自適應(yīng)濾波器可以很好地實(shí)現(xiàn)這一功能。
圖7是運(yùn)用噪聲對(duì)消法得到的左聲道的增強(qiáng)語(yǔ)音示例。
2.4.1 多通道壓縮算法
在聽(tīng)力損失的情況下,聽(tīng)閾普遍下移,從而造成聽(tīng)覺(jué)動(dòng)態(tài)范圍減小。這種動(dòng)態(tài)范圍的減小程度與頻率有關(guān),一般高頻部分損失較大。在數(shù)字助聽(tīng)器信號(hào)處理算法中,聽(tīng)力補(bǔ)償算法是其中最核心的一種算法。聽(tīng)力補(bǔ)償算法的目的是對(duì)聲音進(jìn)行壓縮放大,將正常人聽(tīng)閾范圍內(nèi)的聲音映射至聾人聽(tīng)域內(nèi),并盡可能的保持聽(tīng)覺(jué)舒適和提高聲音的清晰度和辨識(shí)度。
利用濾波器將信號(hào)分頻段處理后再綜合,聲音信號(hào)被分為數(shù)個(gè)獨(dú)立的頻率區(qū)域,這些頻率區(qū)域被稱之為通道。該算法主要致力于在時(shí)域?qū)π盘?hào)進(jìn)行處理。在各個(gè)通道中,根據(jù)患者聽(tīng)力損傷的情況,對(duì)于不同頻段加以不同的放大處理,對(duì)不同頻率成分使用不同的壓縮算法,最后將合成的聲音再發(fā)送到患者的耳道里。這里應(yīng)用該方法對(duì)信號(hào)做了一定的處理,該系統(tǒng)中將中頻信號(hào)做了適當(dāng)?shù)姆糯螅找粜Ч己?。圖8為三通道分頻合成圖。
2.5 系統(tǒng)實(shí)現(xiàn)
系統(tǒng)在實(shí)現(xiàn)時(shí),通過(guò)USB接口將目標(biāo)板和PC機(jī)連接起來(lái)。通過(guò)CCS對(duì)目標(biāo)工程進(jìn)行在線調(diào)試。
目標(biāo)工程的主要任務(wù)是TMS320C5416初始化、管理板上的資源和完成音頻的處理算法。要正確編寫(xiě)采樣和輸出音頻信號(hào)的程序,必須對(duì)TMS320C5416的McBSP的每個(gè)通道包括27個(gè)相關(guān)的寄存器進(jìn)行正確的設(shè)置,以滿足TMs320C5416和其他硬件電路芯片的各種時(shí)序要求(位同步、幀同步、時(shí)鐘信號(hào)等)。圖9為原始的語(yǔ)音信號(hào)在系統(tǒng)中的回放圖形,圖10為在CCS與DSP硬件連接的原始語(yǔ)音與處理后語(yǔ)音的對(duì)比圖形。
3 結(jié)語(yǔ)
該課題設(shè)計(jì)的助聽(tīng)器實(shí)現(xiàn)了小型化、集成化、便捷化。系統(tǒng)還可以根據(jù)患者的具體需求進(jìn)行參數(shù)的更改和設(shè)計(jì),以滿足不同患者的需求。隨著社會(huì)的發(fā)展,在某些特定的場(chǎng)合不僅聽(tīng)力有障礙的人,就是聽(tīng)力正常的人也要借助助聽(tīng)器。人類對(duì)于助聽(tīng)器的需求會(huì)不斷更新,對(duì)于問(wèn)題的探索和研究也將與時(shí)俱進(jìn),使用助聽(tīng)器更好地為人類服務(wù),實(shí)現(xiàn)人與自然和諧相處,從而促進(jìn)社會(huì)和諧發(fā)展。