基于ADPCM的數(shù)字語音存儲與回放系統(tǒng)設(shè)計方案(一)
0 引言
由單片機與FPGA共同完成語音的錄制與回放,可以擁有豐富的接口資源和運算能力,鑒于PCM 的存儲冗余值過大和DPCM 的量化噪聲問題,ADPCM 成為了不錯的壓縮算法。同時為了擁有較高的共模抑制比、低失真、高功率和高輸入阻抗,本文采用儀表放大器、立體聲功率放大和控制芯片,結(jié)合ADPCM編碼,設(shè)計并實現(xiàn)了具有采集速度快、存儲時間長、語音回放質(zhì)量良好的數(shù)字語音存儲與回放系統(tǒng)。
1 系統(tǒng)設(shè)計框圖
系統(tǒng)主要包括采集、處理與語音回放模塊三個部分。對于采集模塊,一般由麥克風(fēng)或者耳機輸入的語音通過前置放大和低通濾波等預(yù)處理之后,完成A/D 轉(zhuǎn)化。對于語音處理模塊來說,進行ADPCM 的編碼以及FFT運算,可將數(shù)字化的語音存儲于外部介質(zhì)。對于回放模塊來說,可提取存儲的語音內(nèi)容,并且通過解碼、D/A轉(zhuǎn)換,最后驅(qū)動揚聲器來完成回放功能。系統(tǒng)整體框圖如圖1所示。
其中的立體聲ADC和立體聲DAC組成部分都集成在芯片PCM3010 內(nèi)部。通過立體聲音量控制芯片PGA3010實現(xiàn)立體聲音量的調(diào)節(jié),最后由功率放大器驅(qū)動揚聲器完成語音播放功能。同時,通過在FPGA內(nèi)部對采樣數(shù)據(jù)進行短時傅里葉變換,可在示波器上實時顯示語音信號的頻譜。
2 理論分析計算
2.1 ADPCM編碼的理論分析
ADPCM 的原理是對相鄰兩采樣值的差值進行編碼,利用自適應(yīng)的思想改變量化階的大小。ADPCM 編碼法結(jié)合了DCM 與ADM,其實是差分算法原理的自適應(yīng)方向改進。對于輸入的信號Si 與自適應(yīng)輸出值Sp 存在差值,根據(jù)自適應(yīng)量化步長d 對此差值進行量化,輸出ADPCM 四位量化碼I.對于量化碼I 又重新計算量化步長d .其原理圖如圖2所示。
另外一方面對于量化碼I,又要送入反量化器,根據(jù)計算的步長d 進行差別斷定,生成新的解碼值,進行下一輪的語音編碼。其原理圖如圖3所示。
通過ADPCM的編碼,可以達到1/6的壓縮比率。也就是說,對于24 b的采樣數(shù)據(jù),4 b的存儲率即可達成要求,可以大大延長存儲的時間。當(dāng)采樣速率為46 kHz時,數(shù)據(jù)傳輸速率為184 Kb/s,由于外部存儲器BQ4015大小為512×8 Kb,故能夠存儲的最長時間為22 s.當(dāng)采樣速率為8 kHz時,能夠存儲的最長時間為128 s.
2.2 信噪比計算
一般認為,通話的語音頻率一般不超過3.4 kHz,所以低通濾波器選取3.4 kHz作為其截至頻率,同時保證A/D采樣頻率高于8 kHz,根據(jù)奈奎斯特定律,即可滿足語音量化不損失。對于耳機聲道聲音,其頻率范圍為20 Hz~20 kHz,所以對于上述的濾波器以及A/D 采樣頻率也能滿足其要求。根據(jù)如下信噪比(單位:dB)公式:
若假定語音信號服從拉普拉斯分布,則xmax = 4σx .
所以可以計算出:
表明量化器中每個比特字長對信噪比的貢獻大約為6 dB.選用24 b A/D 轉(zhuǎn)換器PCM3010,理論上可以達到137 dB的信噪比。
2.3 預(yù)加重處理
為了提升語音質(zhì)量,一般都會對采集的語音進行預(yù)加重處理。使得信號的高頻部分進行提升,同時信號更平坦。處理的時候一般在高頻段按照-6 dB/倍頻程跌落,在FPGA內(nèi)部實現(xiàn)具有6 dB/倍頻程提升高頻特性的預(yù)加重數(shù)字濾波器。選取一階高通濾波器,其特性函數(shù)為:
式中u 值取為0.94~0.97.當(dāng)然,在信號處理之后,還需要通過去加重來還原原本的語音信號。
2.4 分幀加窗處理
為了能用傳統(tǒng)的方法對語音信號進行分析處理,需要對本來是時變語音信號進行加窗處理。假定語音信號在30 ms內(nèi)是平穩(wěn)的,則在30 ms范圍內(nèi)對于語音信號分割加窗。若采樣速率為46 kHz,每幀信號由512個點組成,則一幀的時間長度為11.1 ms,滿足語音信號的短時平穩(wěn)特性。
不同的窗函數(shù)對于信號會有不同的處理結(jié)果,為了選取更優(yōu)的處理結(jié)果,于是對于矩形窗和漢明窗兩個最為典型的窗的特性進行比較,結(jié)果如圖4,圖5所示。
由圖4,圖5可知,矩形窗有不錯的平滑特性,但是在頻譜帶外會有一定的信號損失,會有泄漏現(xiàn)象。而漢明窗雖然平滑特性不好,但是其帶寬卻大于矩形窗,更適合語音信號處理。故在時域中對每幀信號添加漢明窗,再進行傅里葉變換,能更真實地分析其頻譜信息。
顯示頻譜時,由于示波器的分辨率有限,對512 點的頻譜信息,采取每間隔8個點抽取1個點的方式,即得到64 點的頻譜信息。由于顯示時只需顯示0~ fs 2(fs為采樣速率)頻率段的信息,故最后在示波器上清晰地顯示32個點的頻譜。
3 單元模塊電路設(shè)計
3.1 前級放大電路
一般來說,語音的輸入能量不大,為了完成A/D 操作,就需要對輸入的信號進行放大。對于簡單的電路放大設(shè)計,選用最基本的AD620、INA129.對于調(diào)制電阻RG ,通過增益計算公式G = 49.4 kΩ/RG + 1 可以計算得到, RG 使用50 kΩ可調(diào)電位器來達到2.5 倍的增益放大,電路設(shè)計圖如圖6,圖7所示。
3.2 A/D及D/A設(shè)計電路
PCM3010 為24 b 立體聲音頻編碼器,其內(nèi)部包含Σ-Δ 型ADC和DAC.其中立體聲ADC輸入信號峰峰值為3 V,內(nèi)置抗混疊濾波器和高通濾波器,采樣速率為16~96 kHz可調(diào),立體聲DAC輸出信號峰峰值為3 V,內(nèi)置去加重濾波器,轉(zhuǎn)換速率為16~192 kHz可調(diào)。DAC輸出信號接后置低通濾波器,可實現(xiàn)較好的波形輸出。
該芯片將ADC、DAC集成一體,極大地簡化了硬件電路規(guī)模,并且價格便宜,具有極高的性價比。這里在某些數(shù)據(jù)線與控制線上串接了一個小電阻,以降低信號上下邊沿的跳變速率。其電路圖如圖8所示。
3.3 音量控制及功放電路
音量調(diào)節(jié)選用高性能立體聲音頻音量控制芯片PGA2310實現(xiàn)。通過數(shù)字方法控制模擬音量,每聲道音量單獨可調(diào),并具有靜噪功能。它具有極寬的增益衰減范圍,-95.5~31.5 dB 以0.5 dB 步進可調(diào),失真度僅為0.000 4%.其輸出兩路信號送入高效D 類音頻功率放大器TPA2000D4,+5 V 供電驅(qū)動4 Ω負載時功率可達2 W.其靜態(tài)功耗低,外接電路簡單,無需外接LC輸出濾波器,即可直接驅(qū)動揚聲器。電路圖如圖9所示。