基于ADPCM的數(shù)字語音存儲與回放系統(tǒng)設(shè)計方案（一）

時間：2013-10-01 19:58:55

關(guān)鍵字： PCM 系統(tǒng)設(shè)計語音存儲數(shù)字語音

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀]系統(tǒng)以單片機和FPGA為控制核心，實現(xiàn)了語音存儲與回放系統(tǒng)。該系統(tǒng)設(shè)計方案能夠采集模擬語音信號以及耳機立體聲信號，以ADPCM（自適應(yīng)差分編碼）的方式提高了存儲器的利用率，語音存儲時間可達2 min;基于短時傅里葉變換原理，實現(xiàn)了語音信號的頻譜分析與實時顯示。同時，利用立體聲音頻功放播放語音，每聲道音量可調(diào)并具有靜噪功能。此外，該方案還采用預(yù)加重、去加重、抗混疊濾波等措施，有效地提高了信噪比。語音回放質(zhì)量良好，存儲時間較長。

0 引言

由單片機與FPGA共同完成語音的錄制與回放，可以擁有豐富的接口資源和運算能力，鑒于PCM 的存儲冗余值過大和DPCM 的量化噪聲問題，ADPCM 成為了不錯的壓縮算法。同時為了擁有較高的共模抑制比、低失真、高功率和高輸入阻抗，本文采用儀表放大器、立體聲功率放大和控制芯片，結(jié)合ADPCM編碼，設(shè)計并實現(xiàn)了具有采集速度快、存儲時間長、語音回放質(zhì)量良好的數(shù)字語音存儲與回放系統(tǒng)。

1 系統(tǒng)設(shè)計框圖

系統(tǒng)主要包括采集、處理與語音回放模塊三個部分。對于采集模塊，一般由麥克風(fēng)或者耳機輸入的語音通過前置放大和低通濾波等預(yù)處理之后，完成A/D 轉(zhuǎn)化。對于語音處理模塊來說，進行ADPCM 的編碼以及FFT運算，可將數(shù)字化的語音存儲于外部介質(zhì)。對于回放模塊來說，可提取存儲的語音內(nèi)容，并且通過解碼、D/A轉(zhuǎn)換，最后驅(qū)動揚聲器來完成回放功能。系統(tǒng)整體框圖如圖1所示。

其中的立體聲ADC和立體聲DAC組成部分都集成在芯片PCM3010 內(nèi)部。通過立體聲音量控制芯片PGA3010實現(xiàn)立體聲音量的調(diào)節(jié)，最后由功率放大器驅(qū)動揚聲器完成語音播放功能。同時，通過在FPGA內(nèi)部對采樣數(shù)據(jù)進行短時傅里葉變換，可在示波器上實時顯示語音信號的頻譜。

2 理論分析計算

2.1 ADPCM編碼的理論分析

ADPCM 的原理是對相鄰兩采樣值的差值進行編碼，利用自適應(yīng)的思想改變量化階的大小。ADPCM 編碼法結(jié)合了DCM 與ADM,其實是差分算法原理的自適應(yīng)方向改進。對于輸入的信號Si 與自適應(yīng)輸出值Sp 存在差值，根據(jù)自適應(yīng)量化步長d 對此差值進行量化，輸出ADPCM 四位量化碼I.對于量化碼I 又重新計算量化步長d .其原理圖如圖2所示。

另外一方面對于量化碼I,又要送入反量化器，根據(jù)計算的步長d 進行差別斷定，生成新的解碼值，進行下一輪的語音編碼。其原理圖如圖3所示。

通過ADPCM的編碼，可以達到1/6的壓縮比率。也就是說，對于24 b的采樣數(shù)據(jù)，4 b的存儲率即可達成要求，可以大大延長存儲的時間。當(dāng)采樣速率為46 kHz時，數(shù)據(jù)傳輸速率為184 Kb/s,由于外部存儲器BQ4015大小為512×8 Kb,故能夠存儲的最長時間為22 s.當(dāng)采樣速率為8 kHz時，能夠存儲的最長時間為128 s.

2.2 信噪比計算

一般認為，通話的語音頻率一般不超過3.4 kHz,所以低通濾波器選取3.4 kHz作為其截至頻率，同時保證A/D采樣頻率高于8 kHz,根據(jù)奈奎斯特定律，即可滿足語音量化不損失。對于耳機聲道聲音，其頻率范圍為20 Hz~20 kHz,所以對于上述的濾波器以及A/D 采樣頻率也能滿足其要求。根據(jù)如下信噪比(單位：dB)公式：

若假定語音信號服從拉普拉斯分布，則xmax = 4σx .

所以可以計算出：

表明量化器中每個比特字長對信噪比的貢獻大約為6 dB.選用24 b A/D 轉(zhuǎn)換器PCM3010,理論上可以達到137 dB的信噪比。

2.3 預(yù)加重處理

為了提升語音質(zhì)量，一般都會對采集的語音進行預(yù)加重處理。使得信號的高頻部分進行提升，同時信號更平坦。處理的時候一般在高頻段按照-6 dB/倍頻程跌落，在FPGA內(nèi)部實現(xiàn)具有6 dB/倍頻程提升高頻特性的預(yù)加重數(shù)字濾波器。選取一階高通濾波器，其特性函數(shù)為：

式中u 值取為0.94~0.97.當(dāng)然，在信號處理之后，還需要通過去加重來還原原本的語音信號。

2.4 分幀加窗處理

為了能用傳統(tǒng)的方法對語音信號進行分析處理，需要對本來是時變語音信號進行加窗處理。假定語音信號在30 ms內(nèi)是平穩(wěn)的，則在30 ms范圍內(nèi)對于語音信號分割加窗。若采樣速率為46 kHz,每幀信號由512個點組成，則一幀的時間長度為11.1 ms,滿足語音信號的短時平穩(wěn)特性。

不同的窗函數(shù)對于信號會有不同的處理結(jié)果，為了選取更優(yōu)的處理結(jié)果，于是對于矩形窗和漢明窗兩個最為典型的窗的特性進行比較，結(jié)果如圖4,圖5所示。

[!--empirenews.page--]

由圖4,圖5可知，矩形窗有不錯的平滑特性，但是在頻譜帶外會有一定的信號損失，會有泄漏現(xiàn)象。而漢明窗雖然平滑特性不好，但是其帶寬卻大于矩形窗，更適合語音信號處理。故在時域中對每幀信號添加漢明窗，再進行傅里葉變換，能更真實地分析其頻譜信息。

顯示頻譜時，由于示波器的分辨率有限，對512 點的頻譜信息，采取每間隔8個點抽取1個點的方式，即得到64 點的頻譜信息。由于顯示時只需顯示0~ fs 2(fs為采樣速率)頻率段的信息，故最后在示波器上清晰地顯示32個點的頻譜。

3 單元模塊電路設(shè)計

3.1 前級放大電路

一般來說，語音的輸入能量不大，為了完成A/D 操作，就需要對輸入的信號進行放大。對于簡單的電路放大設(shè)計，選用最基本的AD620、INA129.對于調(diào)制電阻RG ,通過增益計算公式G = 49.4 kΩ/RG + 1 可以計算得到， RG 使用50 kΩ可調(diào)電位器來達到2.5 倍的增益放大，電路設(shè)計圖如圖6,圖7所示。

3.2 A/D及D/A設(shè)計電路

PCM3010 為24 b 立體聲音頻編碼器，其內(nèi)部包含Σ-Δ 型ADC和DAC.其中立體聲ADC輸入信號峰峰值為3 V,內(nèi)置抗混疊濾波器和高通濾波器，采樣速率為16~96 kHz可調(diào)，立體聲DAC輸出信號峰峰值為3 V,內(nèi)置去加重濾波器，轉(zhuǎn)換速率為16~192 kHz可調(diào)。DAC輸出信號接后置低通濾波器，可實現(xiàn)較好的波形輸出。

該芯片將ADC、DAC集成一體，極大地簡化了硬件電路規(guī)模，并且價格便宜，具有極高的性價比。這里在某些數(shù)據(jù)線與控制線上串接了一個小電阻，以降低信號上下邊沿的跳變速率。其電路圖如圖8所示。

3.3 音量控制及功放電路

音量調(diào)節(jié)選用高性能立體聲音頻音量控制芯片PGA2310實現(xiàn)。通過數(shù)字方法控制模擬音量，每聲道音量單獨可調(diào)，并具有靜噪功能。它具有極寬的增益衰減范圍，-95.5~31.5 dB 以0.5 dB 步進可調(diào)，失真度僅為0.000 4%.其輸出兩路信號送入高效D 類音頻功率放大器TPA2000D4,+5 V 供電驅(qū)動4 Ω負載時功率可達2 W.其靜態(tài)功耗低，外接電路簡單，無需外接LC輸出濾波器，即可直接驅(qū)動揚聲器。電路圖如圖9所示。