基于MPEG-2算法的列車語音記錄設(shè)備
摘 要:本文介紹了一種新型列車語音記錄設(shè)備的系統(tǒng)架構(gòu)、特點(diǎn)和軟硬件實(shí)現(xiàn)方法。運(yùn)用DSP技術(shù)對(duì)語音信號(hào)進(jìn)行處理、壓縮和記錄,實(shí)現(xiàn)了機(jī)車語音聯(lián)控和列車當(dāng)前狀態(tài)信息的記錄,進(jìn)而規(guī)范乘務(wù)員的工作用語并協(xié)同監(jiān)控裝置分析行車故障。
關(guān)鍵詞:A/D轉(zhuǎn)換;語音數(shù)據(jù)編碼;循環(huán)冗余校驗(yàn)
前言
列車運(yùn)行監(jiān)控記錄裝置在鐵路的安全運(yùn)輸過程中發(fā)揮了巨大的作用,但不足的是沒有語音記錄功能。為了解決這個(gè)問題,按照鐵道部的技術(shù)要求,本文研究開發(fā)了一種新型列車語音記錄設(shè)備。該設(shè)備主要用于對(duì)乘務(wù)員機(jī)車聯(lián)控進(jìn)行錄音,并可協(xié)同監(jiān)控裝置分析行車事故,為機(jī)務(wù)部門和運(yùn)輸部門的科學(xué)管理提供新的技術(shù)手段。鑒于常見設(shè)備的技術(shù)指標(biāo)及標(biāo)準(zhǔn),對(duì)于語音的數(shù)字化,以16KHz的采樣頻率、16位量化精度進(jìn)行采樣,在編碼方面,采用MPEG-2壓縮編碼方式。
硬件系統(tǒng)組成
該語音記錄設(shè)備如圖1所示,整個(gè)系統(tǒng)由 ADC、DSP、CPLD控制器、Flash大容量存儲(chǔ)器及LCD顯示屏等組成。
在本系統(tǒng)中,ADC用來完成信號(hào)的轉(zhuǎn)換,數(shù)據(jù)格式在16、18、20位之間可選,DSP為系統(tǒng)的核心數(shù)字處理器,功能強(qiáng)大,完成數(shù)字信號(hào)的壓縮編碼,CPLD用于數(shù)據(jù)傳送的控制以及對(duì)ADC、Flash和LCD顯示屏等器件的初始化檢測(cè)設(shè)置, Flash用來存儲(chǔ)數(shù)據(jù), LCD顯示屏用來顯示當(dāng)前系統(tǒng)的狀態(tài),如運(yùn)行等待和數(shù)據(jù)處理等。系統(tǒng)上電后,若有語音信號(hào),則輸入ADC,得到一串?dāng)?shù)字信號(hào)送入DSP 進(jìn)行數(shù)據(jù)壓縮編碼,經(jīng)過壓縮編碼的數(shù)據(jù)由CPLD存儲(chǔ)到Flash中,整個(gè)系統(tǒng)以流水線的方式工作,數(shù)據(jù)的采集、壓縮編碼和存儲(chǔ)同時(shí)進(jìn)行。
A/D轉(zhuǎn)換器UDA1341TS
UDA1341TS是由Philips公司生產(chǎn)的一款單片立體聲A/D、D/A轉(zhuǎn)換器,工作電壓為3.0V,信噪比為97dB,具有雙通道輸入功能,采樣頻率在16,32和44.1KHz之間可選。
UDA1341TS與DSP構(gòu)成語音信號(hào)采集系統(tǒng),主要涉及到位采樣時(shí)鐘(BCK)、字同步時(shí)鐘(WS)、采樣數(shù)據(jù)輸出(DATAO)、系統(tǒng)時(shí)鐘輸入(SYSCLK)這幾個(gè)對(duì)時(shí)序有要求的引腳。系統(tǒng)中,DATAO作為輸出引腳,與DSP的BDR0引腳相連;BCK、WS、SYSCLK作為輸入引腳,其時(shí)序由DSP供給。UDA1341TS的系統(tǒng)時(shí)鐘只能是256Fs、384Fs、512Fs,通過對(duì)狀態(tài)寄存器的SC0位和SC1位編程可實(shí)現(xiàn)系統(tǒng)時(shí)鐘的選擇設(shè)置。這里Fs是語音信號(hào)的采樣頻率。在采樣數(shù)據(jù)時(shí),WS用來指明UDA1341TS的DATAO輸出的有效數(shù)據(jù)。當(dāng)系統(tǒng)對(duì)VINL(左聲道)端口進(jìn)行采樣時(shí),WS的上升沿表明一幀數(shù)據(jù)的起始,下降沿表明一幀數(shù)據(jù)的結(jié)束;當(dāng)系統(tǒng)對(duì)VINR(右聲道)端口進(jìn)行采樣時(shí),WS的下降沿表明一幀數(shù)據(jù)的起始,上升沿表明一幀數(shù)據(jù)的結(jié)束。
圖1 系統(tǒng)總體結(jié)構(gòu)圖
UDA1341TS提供了一個(gè)L3端口,利用CPLD控制器對(duì)L3的L3DATA、L3MODE和L3CLOCK三個(gè)引腳進(jìn)行編程,可以設(shè)置其內(nèi)部的寄存器。當(dāng)L3MODE引腳為低電平時(shí),通過L3DATA引腳輸入寄存器地址信息;當(dāng)L3MODE引腳為高電平時(shí),通過L3DATA引腳輸入有關(guān)寄存器設(shè)置的數(shù)據(jù)信息(如設(shè)置芯片系統(tǒng)時(shí)鐘頻率、數(shù)據(jù)輸入格式、芯片工作模式等)。UDA1341TS與DSP的McBSP(多通道緩沖同步串口)相連,各種同步信號(hào)由DSP產(chǎn)生,這樣就保證了新數(shù)據(jù)的正常接收以及已接收數(shù)據(jù)的正常處理。UDA1341TS與DSP的硬件連接如圖2所示。
語音編碼器TMS320VC5402
數(shù)字語音信號(hào)的壓縮需要大量的數(shù)字信號(hào)處理,一般單片機(jī)是無法完成的,所以本系統(tǒng)選用TI公司的DSP芯片TMS320VC5402(以下簡(jiǎn)稱C5402)對(duì)語音信號(hào)進(jìn)行壓縮處理。
C5402通過它的McBSP與語音采樣轉(zhuǎn)換器UDA1341TS通信。McBSP提供了全雙工的通信機(jī)制,以及雙緩存的發(fā)送寄存器和三緩存的接收寄存器,允許連續(xù)的數(shù)據(jù)流傳輸,數(shù)據(jù)寬度在8、12、16、20、24、32位之間可選; McBSP與ADC的通信通過BDR0引腳實(shí)現(xiàn),通信過程的控制則由BCLKR0、BCLKR1、BFSR0等三條引腳實(shí)現(xiàn)。
圖2 UDA1341TS與DSP的硬件連接圖
CPLD低速控制
DSP作為高速的運(yùn)算處理器不適合低速的控制應(yīng)用。對(duì)UDA1341TS檢測(cè)、初始化,對(duì)LCD的控制以及對(duì)Flash的存儲(chǔ)控制都是低速的控制。本系統(tǒng)選用CPLD來完成這些工作, CPLD為Altera公司的EPM7128S,開發(fā)仿真環(huán)境為Altera公司的MAX-PLUSII。因?yàn)镈SP的地址線A0、A1、A2要被某些芯片使用,所以選取A3-A7、A15共6根地址線和I/O空間選擇信號(hào)共同產(chǎn)生系統(tǒng)中各芯片的選通信號(hào)。CPLD中的控制電路
負(fù)責(zé)產(chǎn)生各種讀寫信號(hào),如Flash的讀信號(hào)MEM_RD和寫信號(hào)MEM_WR等。
在該系統(tǒng)中,C5402要產(chǎn)生許多控制信號(hào)(如Flash程序頁的選擇信號(hào)PPG2-PPGO等),同時(shí)也要監(jiān)視和讀取外部的狀態(tài)。因?yàn)镃5402只有兩個(gè)通用I/O引腳,所以用CPLD來對(duì)其進(jìn)行I/O端口擴(kuò)展。CPLD內(nèi)部通過一個(gè)8位DFF觸發(fā)器實(shí)現(xiàn)對(duì)數(shù)據(jù)的輸出。另外,通過8個(gè)三態(tài)門,將8位輸入狀態(tài)放到C5402數(shù)據(jù)總線的低8位上。C5402有4個(gè)中斷輸入。CPLD的中斷選擇模塊可以從最多8個(gè)外部中斷信號(hào)中選擇4個(gè)作為C5402的中斷輸入,提高了系統(tǒng)的靈活性。
圖3 系統(tǒng)主程序
軟件設(shè)計(jì)
軟件設(shè)計(jì)主要包括ADC的程序設(shè)計(jì),語音數(shù)據(jù)的壓縮編碼等。
ADC的程序設(shè)計(jì)
ADC以16KHz的采樣頻率、16位量化精度進(jìn)行采樣,采樣的位同步信號(hào)、幀同步信號(hào)、數(shù)據(jù)位時(shí)鐘信號(hào)均由DSP提供,所以對(duì)McBSP相關(guān)寄存器的編程,如引腳控制寄存器(PCR)的編程,串口控制器(SPCR1,SPCR2)的編程,接收控制寄存器(RCR1x,RCR2x)以及發(fā)送控制寄存器(XCR1,XCR2)的編程會(huì)影響語音信號(hào)的最終效果,所以用戶在開發(fā)之前必須詳細(xì)參閱相關(guān)資料。
圖4 幀內(nèi)編碼流程
語音數(shù)據(jù)編碼
本文采用通用的MPEG-2語音壓縮編碼算法,該算法是幀數(shù)據(jù)結(jié)構(gòu)編碼,一幀的樣點(diǎn)值是576,以UDA1341TS 的16KHz采樣頻率計(jì)算,一幀數(shù)據(jù)的編碼要求在72ms內(nèi)完成。C5402的指令周期是10ns,在滿足算法要求的情況下,進(jìn)行雙通道實(shí)時(shí)編碼約需要10ms,所以C5402可以完成該算法的實(shí)時(shí)編碼。主要包括以下幾方面:濾波器組的運(yùn)算;心理聲學(xué)模型的運(yùn)算; 量化編碼;幀數(shù)據(jù)格式化。
濾波器組的作用是完成信號(hào)從時(shí)域到頻域的映射。心理聲學(xué)模型的計(jì)算是利用1024點(diǎn)的FFT,對(duì)輸入的語音信號(hào)進(jìn)行頻譜分析,再結(jié)合時(shí)頻映射的結(jié)果,計(jì)算出各子帶人耳的掩蔽特性。量化編碼是通過各子帶人耳的掩蔽特性和輸出比特率的要求,計(jì)算出各子帶編碼所需的比特分配信息,并且對(duì)各子帶數(shù)據(jù)進(jìn)行線性量化編碼的過程。程序的后續(xù)工作是按照MPEG-2標(biāo)準(zhǔn)對(duì)數(shù)據(jù)進(jìn)行格式化,其目的是使數(shù)據(jù)編碼后能被正確地解碼,系統(tǒng)主程序如圖3所示。
幀內(nèi)編碼是DSP按照MPEG-2標(biāo)準(zhǔn)對(duì)ADC傳來的數(shù)字語音信號(hào)進(jìn)行壓縮編碼,其流程如圖4所示。
結(jié)語
系統(tǒng)上電運(yùn)行后,經(jīng)多次實(shí)驗(yàn)測(cè)試,運(yùn)行情況穩(wěn)定。目前該設(shè)備已經(jīng)進(jìn)行現(xiàn)場(chǎng)調(diào)試運(yùn)用,開始部分裝車運(yùn)行,滿足了列車語音記錄的實(shí)際要求。
參考文獻(xiàn):
1 Philips Semiconductors. UDA1341TS Product specification [Z].Netherlands:Philips Semicon ductors,2002