基于DSP的通用語音編譯碼器設(shè)計與實現(xiàn)
摘要:實現(xiàn)了一種基于DSP的通用語音編譯碼器實驗平臺。在該平臺上通過軟件重構(gòu)可以實現(xiàn)常用語音信號的編譯碼。詳細介紹了應(yīng)用DSP實現(xiàn)通用語音編譯碼中的關(guān)鍵技術(shù),包括硬件平臺設(shè)計、軟件結(jié)構(gòu)和接口擴展等。由于硬件和軟件采用模塊和結(jié)構(gòu)化設(shè)計,通過開放的模塊接口和子程序使得該設(shè)計具有擴展和升級容易、學(xué)生參與度高等優(yōu)點。最后通過實際測試驗證了設(shè)計的正確性。
關(guān)鍵詞:語音信號處理;DSP;編碼器;解碼器;實驗系統(tǒng)
0 引言
語音信號處理在通信系統(tǒng)中占有重要地位,也是通信工程專業(yè)的重要課程。由于課程內(nèi)容比較抽象,如果只是停留在理論教學(xué),會使學(xué)生不易理解并且感到枯燥乏味,同時也不容易體現(xiàn)它的實現(xiàn)原理以及在實際通信系統(tǒng)的位置和作用。語音編譯碼器的實現(xiàn)主要有三種方法:專用芯片、基于DSP和混合方法。其中,DSP5000系列以其內(nèi)含硬件乘法器、硬件加法器和FFT運算器特別適合用于語音信號處理。文獻提出一種基于DSP的多制式語音編解碼器,文獻給出一種可變速率的通用語音編解碼實現(xiàn)技術(shù),但都不適合實驗教學(xué)。本文在文獻的基礎(chǔ)上,結(jié)合實驗教學(xué)特點設(shè)計一種語音編譯碼器實驗平臺,其設(shè)計思想是采用通用的DSP,CPLD,控制器和PC機將語音信號處理過程在硬件、軟件、接口和PC機管理幾個方面實現(xiàn)模塊化和開放接口設(shè)計。通過PC機或控制器,可以設(shè)置編碼方式、調(diào)用不同的子程序?qū)崿F(xiàn)不同的編碼算法,同時也設(shè)置了計算機數(shù)據(jù)接口來實現(xiàn)編解碼器的通用性,方便直觀地了解語音信號的處理過程,易于不同層次、不同目的的學(xué)生參與,具有方便實現(xiàn)設(shè)計性、系統(tǒng)性、綜合性和創(chuàng)新性實驗等優(yōu)點。該平臺可以實現(xiàn)G.711,G.721,G.729和△M四種符合國際標準的編解碼。為了觀察信號的處理過程,在硬件電路的關(guān)鍵點都設(shè)置有測試點;其次,在軟件設(shè)計上也盡量將程序分解成子程序由主程序調(diào)用,如初始化子程序、命令解
析子程序、信號采集與輸出子程序、編譯碼子程序、數(shù)據(jù)接收與發(fā)送子程序等。每個子程序的人口都有相應(yīng)的函數(shù)名、要傳遞的參數(shù)和返回的結(jié)果,這樣便于學(xué)生參與各個算法子程序的設(shè)計。文中給出了詳細的硬件電路設(shè)計和軟件流程圖,最后對實驗平臺進行了測試,結(jié)果正確且工作穩(wěn)定可靠。
1 系統(tǒng)結(jié)構(gòu)與硬件電路設(shè)計
在硬件設(shè)計上根據(jù)功能分了6個模塊,包括濾波器與放大模塊、A/D與D/A轉(zhuǎn)換器模塊、DSP處理器模塊、FPGA與數(shù)據(jù)接口模塊、MCU控制器與PC機接口模塊、鍵盤/顯示器模塊。為了防止干擾和方便學(xué)生觀察信號,各模塊之間的控制線通過通用底板相連,而信號通過各個模塊的信號線相連。系統(tǒng)結(jié)構(gòu)如圖1所示。
圖1中,抗混疊濾波器采用二階有源低通濾波器;音頻接口芯片選擇TI公司性價比較高的A/D轉(zhuǎn)換芯片TLV320AIC23,它可以在8~96 kHz的采樣頻率范圍內(nèi)提供16 b,20 b,24 b和32 b的采樣數(shù)據(jù),其DSP Mode是TI公司特有的與DSP連接模式,使音頻接口設(shè)計非常簡單,如對于PCM編碼則根據(jù)AIC23的數(shù)據(jù)手冊只需在其時鐘輸入端MCLK引腳外接一個12.288 MHz的有源晶振,配置AIC23的采樣率控制寄存器的SR3~SR0= 0011,即可得到AIC23的A/D和D/A的采樣率為8 kHz;DSP選擇TI公司的TMS320VC5416,它采用增強的多總線和優(yōu)化的CPU設(shè)計結(jié)構(gòu),內(nèi)含三個多通道緩沖串口McBSP和8/16 b的增強型HPI口,不但可以滿足語音編譯碼算法處理的需求,也方便實現(xiàn)主機訪問;SRAM和FLASH分別采用常用的芯片CY7C1041CV33和SST39VF400(兩者存儲空間均為256K×16 b),外擴存儲器的控制時序通過CPLD(EPM3128ATC100)實現(xiàn);控制器采用AT89C52,它通過DSP的HPI口與DSP相連,其優(yōu)點是可以通過DSP內(nèi)部的雙口RAM訪問DSP內(nèi)部的各種資源,而不會影響DSP的運行。同時,控制器擴展了鍵盤/顯示和RS 232接口(預(yù)留了USB接口),不但方便用戶使用,也實現(xiàn)了上位機軟件與編譯碼器的通信。
系統(tǒng)工作原理如下:首先來自用戶的語音信號先經(jīng)過抗混疊濾波器模塊完成信號的濾波和放大,然后送A/D、D/A模塊將模擬語音信號轉(zhuǎn)換成相應(yīng)標準速率(如8 kHz)和采樣精度(如16 b)的數(shù)字信號,數(shù)字化的語音信號通過多通道緩沖串口McBSP0送給DSP信號處理板,信號處理板將語音數(shù)據(jù)信號送到DSP內(nèi)部緩沖區(qū),在緩沖區(qū)內(nèi)按用戶選擇的方法調(diào)用編碼算法編成特定碼率的碼流,再將得到的標準數(shù)字碼流送數(shù)據(jù)接口模塊輸出;另一方面,來自數(shù)據(jù)接口的碼流送數(shù)據(jù)處理模塊,數(shù)據(jù)處理模塊由其多通道緩沖串口McBSP2接收至DSP的內(nèi)部接收緩沖區(qū),然后由DSP對其進行解碼處理,解碼后的數(shù)字化語音通過多通道緩沖串口McBSP0傳送給D/A轉(zhuǎn)換器模塊轉(zhuǎn)換成模擬語音信號后送信號濾波和放大模塊,從而實現(xiàn)語音信號的采集、編碼、發(fā)送和接收、解碼等功能。
[!--empirenews.page--]
2 軟件設(shè)計
軟件設(shè)計包括DSP程序、控制器程序、CPLD程序和上位機程序四部分。DSP程序根據(jù)命令完成語音信號和計算機數(shù)據(jù)的處理等;控制器程序完成本地對編譯碼器的管理,并負責(zé)DSP與PC之間的通信;CPLD程序除完成系統(tǒng)需要的組合、時序工作外,還要提供與調(diào)制/解調(diào)器的數(shù)據(jù)接口;上位機程序完成對語音編譯碼器的管理。下面介紹部分程序的設(shè)計原理。
2.1 DSP程序設(shè)計
DSP程序主要包括主程序、命令解析子程序、模擬信號采集與輸出子程序、編譯碼子程序、數(shù)據(jù)信號接收與發(fā)送子程序等。DSP完成G.711規(guī)范的A-Law編譯碼程序流程圖如圖2所示。
在DSP響應(yīng)控制器程序中設(shè)置一個控制標志位CON_SEL,并分配在DSP數(shù)據(jù)空間內(nèi)的0x1fffH地址,控制器根據(jù)用戶從鍵盤輸入的命令(或來自PC機的命令)向此地址寫入相應(yīng)的控制標志,DSP的底層程序響應(yīng)該控制標志位完成相應(yīng)的工作(MIC語音處理、線路語音處理和數(shù)據(jù)通信)。DSP響應(yīng)控制器程序流程圖如圖3所示。從流程圖中可以看到,對于語音處理,程序先打開中斷。當A/D采集完語音數(shù)據(jù)后,即進入中斷服務(wù)程序,在中斷服務(wù)程序中關(guān)閉全局中斷,并設(shè)置數(shù)據(jù)是否滿的標志位為有效狀態(tài)。主程序查詢該標志位,如果有效則調(diào)語音處理子程序進行處理,處理完調(diào)用通信程序輸出;而對于數(shù)據(jù)通信的處理過程是,DSP首先在內(nèi)部開辟一個數(shù)據(jù)緩沖區(qū),并打開HPI中斷和全局中斷,然后DSP主程序進入數(shù)據(jù)處理程序,這時接收來自單片機(或PC機)的數(shù)據(jù)通過數(shù)據(jù)口傳輸出去,傳送完后可通過HINT去中斷控制器,通知主機傳送下一個數(shù)據(jù)。
[!--empirenews.page--]
2.2 控制器程序設(shè)計
控制器工作有兩個狀態(tài),即本地控制工作狀態(tài)和通信傳輸工作狀態(tài)。本地控制狀態(tài)就是實現(xiàn)對編譯碼器的控制與管理,而通信工作狀態(tài)僅僅完成DSP與PC機之間的信息傳輸,這里只說明DSP、控制器和PC機之間的程序設(shè)計。由于DSP的HINT引腳和單片機的INT0引腳相連接,HINT中斷有效觸發(fā)的是單片機的INT0中斷,所以PC機的上位機軟件要響應(yīng)DSP的中斷只能在控制器與PC機的控制協(xié)議中完成,DSP在發(fā)送完成一個數(shù)據(jù)后無法采用中斷的方式告訴上位機。為解決這個問題,上位機采用查詢的方式,即在控制器中設(shè)置一個標志位send_end,初始化為0,當DSP發(fā)送完一個字節(jié)數(shù)據(jù)后置該標志位為1,上位機每發(fā)送完一個數(shù)據(jù),通過控制器觸發(fā)一次DSPINT中斷,并讀回send_end的值判斷,若為1則傳送下一個字節(jié),否則等待控制器將當前數(shù)據(jù)發(fā)送完成。
2.3 上位機軟件設(shè)計
上位機軟件采用學(xué)生容易掌握的VB語言實現(xiàn),其主界面如圖4所示。
主界面主要完成系統(tǒng)初始化,并顯示系統(tǒng)需要檢測和控制的內(nèi)容。初始化正常后,上位機程序即可通過控制器向DSP的指令地址發(fā)送控制命令,DSP查詢此地址的命令字,并根據(jù)命令字進入相應(yīng)的服務(wù)程序(MIC語音、線路語音或數(shù)據(jù)通信。DSP在初始化中默認的是MIC語音處理),如果要進行線路語音處理則在控制界面上選擇“線路輸入語音”控制命令,這時控制子界面將用戶選擇的命令通過控制器送DSP,DSP查詢到并判斷是線路輸入語音命令后即執(zhí)行線路輸入語音子程序,這時如果將數(shù)據(jù)輸出端口與數(shù)據(jù)輸入端口、對應(yīng)的同步信號連接好的話,從耳機可聽到經(jīng)過語音編碼和譯碼后的電腦播放的音樂,從聽到的音樂比較編譯碼后的語音質(zhì)量。如果在命令控制界面選擇“計算機數(shù)據(jù)通信”控制命令,即可進行計算機數(shù)據(jù)通信實驗。
3 實際測試
3.1 語音信號編譯碼測試
首先將PC機的線路輸出用信號線連接到編譯碼器的LINE輸入,啟動編譯碼實驗系統(tǒng),然后由PC機播放MP3音樂,測試得到的8 kHz幀同步和64 kHz位同步時鐘的波形如圖5所示。
圖6是在64 kHz位同步時鐘情況下編碼后的音樂數(shù)據(jù)波形,在譯碼器輸出端用耳機可以聽到MOS分在4 dB以上的音樂。[!--empirenews.page--]
3.2 數(shù)據(jù)傳輸測試
首先在上位機軟件的控制界面中選擇計算機數(shù)據(jù)通信命令,在彈出的數(shù)據(jù)通信對話框中輸入測試數(shù)據(jù)1234,如圖7所示。
DSP結(jié)束當前語音通信過程后即進入數(shù)據(jù)通信子程序,這時可以從主界面的編輯對話框中輸入要傳輸?shù)臄?shù)據(jù)(也可以選擇PC機中的文件),點擊“確認”按鈕,編譯碼實驗系統(tǒng)即可完成數(shù)據(jù)通信,圖8給出以64 Kb/s的速率傳輸?shù)臄?shù)據(jù),同時PC機從DSP端讀回所發(fā)送的數(shù)據(jù),可以看到數(shù)據(jù)完全正確。
對于傳輸文件,先選擇*.txt數(shù)據(jù)文件,然后點擊“確認”,則*.txt文件中的數(shù)據(jù)將通過控制器發(fā)送到DSP中指定的發(fā)送緩沖區(qū)中,DSP將發(fā)送緩沖區(qū)中的數(shù)據(jù)以64 Kb/s的速率從數(shù)字接口McBSP2發(fā)送出去。如果將數(shù)據(jù)接口的發(fā)送和接收端用測試線連接起來,則DSP接收回到接收緩沖區(qū)中,軟件從其接收緩沖區(qū)中讀回數(shù)據(jù),圖9是寫入DSP發(fā)送緩沖區(qū)的數(shù)據(jù),在CCS中觀察與所發(fā)送的數(shù)據(jù)完全一致。
4 結(jié)語
本文設(shè)計并實現(xiàn)了一種基于DSP的通用語音編譯碼器實驗平臺。該平臺硬件采用模塊化設(shè)計,軟件采用結(jié)構(gòu)化設(shè)計,非常方便學(xué)生從不同層面參與實驗,也非常適合以團隊的方式完成實驗項目,將比較復(fù)雜、內(nèi)容比較多的實驗項目分解成易于實現(xiàn)的小模塊,同時模塊和結(jié)構(gòu)化的設(shè)計思想非常容易實現(xiàn)硬件和軟件的擴展和升級,可以從硬件和軟件等多方面培養(yǎng)學(xué)生的設(shè)計、綜合以及創(chuàng)新等能力。從仿真和測試結(jié)果可以看到設(shè)計的正確性。