基于ACELP語(yǔ)音編譯碼算法的軟件實(shí)現(xiàn)及應(yīng)用
摘要:文中針對(duì)Tetra通信系統(tǒng)中采用的ACELP算法,分析了該算法的基本原理,介紹了其算法基于VC++6.0的軟件實(shí)現(xiàn)過(guò)程,重點(diǎn)闡述了ACELP在網(wǎng)絡(luò)通信中的實(shí)現(xiàn)及應(yīng)用情況。
隨著通信技術(shù)的快速發(fā)展,語(yǔ)音編碼技術(shù)發(fā)展越來(lái)越迅速、應(yīng)用越來(lái)越廣泛。TETRA(Terrestrial Trunked Radio)集群通信系統(tǒng)是歐洲電信標(biāo)準(zhǔn)協(xié)會(huì)ETSI制定的數(shù)字集群移動(dòng)通信標(biāo)準(zhǔn)。近幾年發(fā)展很快,其產(chǎn)品已被包括我國(guó)在內(nèi)的世界多個(gè)國(guó)家廣泛采用。TETRA承載的語(yǔ)音通信業(yè)務(wù)采用ACELP語(yǔ)音編碼算法,該算法是一種改進(jìn)型的CELP,它繼承了傳統(tǒng)CELP的主要優(yōu)點(diǎn),并克服了其缺點(diǎn)。傳統(tǒng)CELP用固定的隨機(jī)碼本來(lái)逼近語(yǔ)音信號(hào)的余量信號(hào),缺乏靈活性,不能很好地控制碼本的頻域特性。ACELP采用代數(shù)碼本結(jié)構(gòu),不僅降低了碼本的存儲(chǔ)量和搜索量,還提供了頻域控制函數(shù),從而增強(qiáng)了碼本的靈活性和多樣性,能更好地逼近余量信號(hào),保證了高質(zhì)量的語(yǔ)音服務(wù)。該算法占用帶寬較小,其編碼速率僅為4.567 kbps,同時(shí)編碼語(yǔ)音質(zhì)量高,特別適合多媒體語(yǔ)音通信使用。目前該算法已有許多在嵌入式系統(tǒng)中實(shí)現(xiàn)的方案,但由于編譯環(huán)境以及硬件條件的限制,應(yīng)用不夠靈活方便,因此本文基于Visual C++軟件編程技術(shù),采用服務(wù)器與客戶端網(wǎng)絡(luò)通信模式,在服務(wù)器端采用聲卡對(duì)語(yǔ)音信號(hào)進(jìn)行實(shí)時(shí)AD采樣,對(duì)采樣數(shù)據(jù)進(jìn)行ACELP語(yǔ)音編碼處理,并將編碼后數(shù)據(jù)通過(guò)網(wǎng)絡(luò)實(shí)時(shí)發(fā)送到客戶端;在客戶端實(shí)時(shí)接收服務(wù)器端發(fā)送的語(yǔ)音編碼數(shù)據(jù)并進(jìn)行軟件譯碼處理,同時(shí)將譯碼后數(shù)據(jù)采用聲卡進(jìn)行實(shí)時(shí)播放,從而實(shí)現(xiàn)基于ACELP算法的網(wǎng)絡(luò)語(yǔ)音通信。
1 ACELP語(yǔ)音編譯碼算法的基本原理
ACELP是一種改進(jìn)的代數(shù)碼本激勵(lì)線性預(yù)測(cè)算法,該算法要求輸入語(yǔ)音信號(hào)為8 kHz采樣、16比特量化,信號(hào)以30 ms分幀,每一幀分為4個(gè)子幀,每個(gè)子幀7.5 ms,每幀數(shù)據(jù)編碼后為137比特,包括線性預(yù)測(cè)參數(shù)、基音延遲T、最佳碼本索引和最佳增益參數(shù)。編碼器原理框圖如圖1所示。
編碼過(guò)程主要由短時(shí)預(yù)測(cè)、長(zhǎng)時(shí)線性預(yù)測(cè)、碼本搜素和增益計(jì)算等組成。其中短時(shí)預(yù)測(cè)提取聲道濾波器的LPC系數(shù)并進(jìn)行插值和量化;長(zhǎng)時(shí)線性預(yù)測(cè)通常分為開(kāi)環(huán)基音分析和閉環(huán)基音分析兩步,開(kāi)環(huán)基音分析每幀數(shù)據(jù)(30 ms)處理一次,采用自相關(guān)法估算基音周期,按較低基音延遲優(yōu)先的原則獲取基音周期的大致范圍,閉環(huán)基音分析基于子幀完成,每7.5 ms處理一次,以獲取基音周期的準(zhǔn)確值;碼本搜索和增益計(jì)算主要用于計(jì)算合適的碼本和增益,使重建語(yǔ)音的質(zhì)量具有更高的清晰度和自然度。
解碼過(guò)程就是將線性預(yù)測(cè)參數(shù)、基音延遲T、最佳碼本索引和最佳增益參數(shù)等各個(gè)編碼參數(shù)等從編碼比特流中提取出來(lái),重構(gòu)輸出信號(hào)和各個(gè)濾波器,最后得到重構(gòu)語(yǔ)音。解碼過(guò)程以分幀為單位進(jìn)行。首先將LSP矢量轉(zhuǎn)換為L(zhǎng)P濾波器系數(shù),然后通過(guò)基音延時(shí)查找基音的整數(shù)和分?jǐn)?shù)分量,將激勵(lì)進(jìn)行解碼,對(duì)解碼后的激勵(lì)信號(hào)通過(guò)后基音濾波器送入合成濾波器,得到合成信號(hào)。合成信號(hào)經(jīng)過(guò)共振峰后濾波器和增益放大單元控制得到語(yǔ)音信號(hào)。其ACELP解碼原理框圖如圖2所示。
2 ACELP語(yǔ)音編譯碼算法的軟件實(shí)現(xiàn)概述
根據(jù)ACELP語(yǔ)音編譯碼算法原理.本文基于VC++6.0軟件平臺(tái),采用面向?qū)ο笏枷?,編制CTetra_ACELP_Cod類(lèi)和CTetra_ACELP_Dec類(lèi)分別實(shí)現(xiàn)語(yǔ)音信號(hào)編、譯碼。另外,本文采用動(dòng)態(tài)鏈接庫(kù)方式對(duì)編譯碼類(lèi)進(jìn)行封裝,接口簡(jiǎn)潔,使用方便。
2.1 CTetra_ACELP_Cod編碼類(lèi)
該類(lèi)為ACELP語(yǔ)音編碼類(lèi),主要實(shí)現(xiàn)對(duì)輸入該模塊的8 kHz采樣,16比特量化的語(yǔ)音樣點(diǎn)數(shù)據(jù)流進(jìn)行編碼,類(lèi)的主要函數(shù)定義如下:
其中Init(TETRA_ACELP_COD_PARAM*pCodParam)函數(shù)完成編碼模塊初始化工作,TETRA_ACELP_COD_PARAM結(jié)構(gòu)體參數(shù)實(shí)時(shí)存儲(chǔ)編碼過(guò)程中相關(guān)參數(shù)。void PreProcess(Word16 signal[],Word16 lg)函數(shù)完成待編碼語(yǔ)音信號(hào)幀的預(yù)處理。ACELPCod(Word16 signal[],Word16parm[],TETRA_ACELP_COD_PARAM*pCodParam)函數(shù)完成語(yǔ)音編碼處理,signal[]參數(shù)為待編碼的語(yǔ)音樣本幀數(shù)據(jù),parm[]為編碼后參數(shù)。Prm2 bi ts(Word16 prm[],Word16 bits[])函數(shù)實(shí)現(xiàn)編碼參數(shù)到比特流的轉(zhuǎn)化。
2.2 CTetra_ACELP_Dec編碼類(lèi)
該類(lèi)為ACELP語(yǔ)音譯碼類(lèi),主要實(shí)現(xiàn)對(duì)輸入該模塊編碼數(shù)據(jù)幀(137比特幀長(zhǎng))進(jìn)行譯碼處理,輸出8KHz采樣,16比特量化的語(yǔ)音數(shù)據(jù)。類(lèi)的主要函數(shù)定義如下:
其中Init(TETRA_ACELP_DEC_PARAM*pDecParam)函數(shù)完成譯碼模塊的初始化工作,TETRA_ACELP_DEC_PARAM結(jié)構(gòu)體參數(shù)實(shí)時(shí)存儲(chǔ)譯碼過(guò)程中相關(guān)參數(shù)。Bits2prm(Word16 bits[],Word16 prm[])函數(shù)實(shí)現(xiàn)137比特幀數(shù)據(jù)到ACELP編碼參數(shù)的轉(zhuǎn)化。ACELPDec(Word16 parm[],Word16 synth[],TETRA_ACELP_DEC_PARAM*pDecParam)函數(shù)完成編碼參數(shù)的譯碼處理。編碼參數(shù)通過(guò)ana數(shù)組返回。PostProcess(Word16 signal[],Word16 lg)對(duì)合成語(yǔ)音進(jìn)行后處理工作。
2.3 動(dòng)態(tài)鏈接庫(kù)封裝接口介紹
其中bits為137比特編碼比特幀,signal為240*16bits的語(yǔ)音樣點(diǎn)數(shù)據(jù),pCodParam和pDecParam為編、譯碼過(guò)程中的中間結(jié)構(gòu)體參量。
3 ACELP編譯碼算法在網(wǎng)絡(luò)通信中的應(yīng)用
采用網(wǎng)絡(luò)服務(wù)器、客戶端通信模式,將ACELP編譯碼模塊應(yīng)用到網(wǎng)絡(luò)語(yǔ)音通信中,最終實(shí)現(xiàn)了基于ACELP算法的網(wǎng)絡(luò)語(yǔ)音通信。具體通信過(guò)程為:服務(wù)器端采用聲卡以8 kHz采樣,16比特量化方式對(duì)語(yǔ)音信號(hào)進(jìn)行實(shí)時(shí)采集,對(duì)采集到的語(yǔ)音信號(hào)每240樣點(diǎn)作為一幀送入ACELP編碼模塊進(jìn)行壓縮編碼,壓縮后編碼數(shù)據(jù)幀長(zhǎng)為137比特,每幀數(shù)據(jù)進(jìn)一步封裝處理后通過(guò)網(wǎng)絡(luò)實(shí)時(shí)發(fā)送到客戶端。客戶端通過(guò)網(wǎng)絡(luò)實(shí)時(shí)接收服務(wù)器端編碼語(yǔ)音數(shù)據(jù)包,經(jīng)ACELP譯碼處理后實(shí)時(shí)發(fā)送到聲卡進(jìn)行播放處理,從而實(shí)現(xiàn)網(wǎng)絡(luò)語(yǔ)音通信。
3.1 語(yǔ)音信號(hào)實(shí)時(shí)采集與播放技術(shù)實(shí)現(xiàn)
在語(yǔ)音信號(hào)實(shí)時(shí)采集與播放實(shí)現(xiàn)過(guò)程中,如何實(shí)現(xiàn)聲卡采集與播放數(shù)據(jù)的實(shí)時(shí)性、連續(xù)性和可靠性是軟件設(shè)計(jì)的關(guān)鍵所在。在本文軟件系統(tǒng)中,通過(guò)直接凋用Windows最底層波形音頻接口函數(shù),實(shí)現(xiàn)聲卡的編程控制,系統(tǒng)中采用了多線程多緩沖技術(shù),即在服務(wù)器端,聲卡采集與語(yǔ)音壓縮編碼使用不同的工作線程,同時(shí)給聲卡提供多個(gè)用于承載采集數(shù)據(jù)的緩沖區(qū),在同一時(shí)刻部分緩沖區(qū)供聲卡采集線程裝載數(shù)據(jù)的同時(shí),另外已經(jīng)裝滿數(shù)據(jù)的緩沖區(qū)供語(yǔ)音壓縮數(shù)據(jù)處理線程處理,從而使得語(yǔ)音信號(hào)采集和壓縮編碼處理工作同時(shí)進(jìn)行,有效保證了采集數(shù)據(jù)的連續(xù)性和信號(hào)處理的實(shí)時(shí)性。服務(wù)器端聲卡實(shí)時(shí)采集原理框圖如圖3所示。
3.2 網(wǎng)絡(luò)通信技術(shù)實(shí)現(xiàn)
軟件系統(tǒng)采用客戶/服務(wù)器模式和TCP/IP協(xié)議,利用Socket套接字編程技術(shù)實(shí)現(xiàn)數(shù)據(jù)接收與發(fā)送。其中數(shù)據(jù)接收模塊采用VC++的CSo cket類(lèi),具體通信過(guò)程為:1)程序啟動(dòng)的時(shí)候在指定端口創(chuàng)建網(wǎng)絡(luò)監(jiān)聽(tīng)套接字,用以監(jiān)聽(tīng)客戶端的連接請(qǐng)求。2)當(dāng)有客戶請(qǐng)求連接時(shí),創(chuàng)建接收套接字與客戶端建立連接。3)當(dāng)有數(shù)據(jù)需要接收時(shí),CAcceptSocket響應(yīng)OnReceive消息,調(diào)用Receive函數(shù)從緩沖里獲取客戶端傳來(lái)的數(shù)據(jù),實(shí)時(shí)的交給ACELP譯碼線程進(jìn)行譯碼還原處理。4)當(dāng)通信結(jié)束時(shí),關(guān)閉監(jiān)聽(tīng)套接字和接收套接字并釋放資源。數(shù)據(jù)發(fā)送接口采用SOCKET通信技術(shù),為了使系統(tǒng)在實(shí)時(shí)編碼處理的同時(shí)及時(shí)將編碼數(shù)據(jù)發(fā)送到服務(wù)器端,軟件采用多線程技術(shù);同時(shí)為了避免由于待發(fā)送數(shù)據(jù)流不均勻?qū)е碌臄?shù)據(jù)幀丟失等情況發(fā)生,系統(tǒng)采用了多緩沖機(jī)制。主程序編碼模塊將要發(fā)送的編碼數(shù)據(jù)源源不斷的向緩沖隊(duì)列中寫(xiě),同時(shí)發(fā)送線程不斷的檢測(cè)緩沖隊(duì)列中緩沖情況,當(dāng)有緩沖滿時(shí)及時(shí)進(jìn)行發(fā)送。由于多線程與多緩沖機(jī)制的有效使用,使得網(wǎng)絡(luò)通信能夠?qū)崟r(shí)高效的運(yùn)行。
3.3 系統(tǒng)情況介紹
該系統(tǒng)實(shí)現(xiàn)了基于ACELP算法的網(wǎng)絡(luò)語(yǔ)音通信,能夠?qū)νㄐ胚^(guò)程中的語(yǔ)音波形樣本數(shù)據(jù)、ACELP編碼數(shù)據(jù)等進(jìn)行實(shí)時(shí)存儲(chǔ)和網(wǎng)絡(luò)發(fā)送,對(duì)通行過(guò)程中的波形進(jìn)行實(shí)時(shí)顯示等。系統(tǒng)運(yùn)行穩(wěn)定,延遲較小,語(yǔ)音通信質(zhì)量較好。圖4所示為本文設(shè)計(jì)的軟件系統(tǒng)運(yùn)行截圖。
4 結(jié)束語(yǔ)
文中研究了TETRA系統(tǒng)采用的ACELP語(yǔ)音編譯碼算法,在此基礎(chǔ)上基于VC++編程技術(shù)實(shí)現(xiàn)ACELP編、譯碼軟件模塊,并采用動(dòng)態(tài)鏈接庫(kù)對(duì)其進(jìn)行封裝處理,接口簡(jiǎn)單,使用方便。最后開(kāi)發(fā)相應(yīng)系統(tǒng),實(shí)現(xiàn)了ACELP編譯碼算法在網(wǎng)絡(luò)語(yǔ)音通信中的應(yīng)用。經(jīng)實(shí)踐證明,ACELP算法編碼質(zhì)量高,性能優(yōu)異,具有較好的應(yīng)用價(jià)值。