基于DM642的定位視音頻采集器的設計與實現(xiàn)
地理信息系統(tǒng)( GIS)、全球定位系統(tǒng)( GPS)的廣泛應用使人們享受到了基于位置服務所帶來的諸多便利。傳統(tǒng)G IS 是以地圖為可視化主要手段, 然而人類獲取信息的70%來自于視覺, 因此將地理位置信息和視頻信息有機結(jié)合可以極好的豐富G IS的內(nèi)容, 產(chǎn)生許多新的應用。比如微軟的Windows Local Live、影像城市武漢等網(wǎng)站都相繼推出了實景地圖, 讓人們在網(wǎng)絡上能直觀、全面和便捷的了解各個城市。GPS信息和視頻信息的結(jié)合, 還有利于對地理信息系統(tǒng)進行3D 建模, 如日本巖根研究所推出的3DV ideoG IS軟件, 通過陸地上以及空中拍攝的具有定位信息的全景視頻圖像, 可以自動生成相應的高逼真的3D 場景模型。
為了針對以上這些應用需求, 本文中提出了一種一體化的視頻、音頻和定位信息的數(shù)據(jù)采集傳輸器。
本采集器不僅可以通過網(wǎng)絡直播的方式提供一個更自然、更真實、更及時的地理信息系統(tǒng)環(huán)境, 采集數(shù)據(jù)能為實景地圖和3D 場景地圖的構(gòu)建提供素材, 還可以實現(xiàn)基于定位信息的視音頻數(shù)據(jù)的分割和檢索。
1 系統(tǒng)整體方案
為了實現(xiàn)采集器的高質(zhì)量定位視音頻壓縮采集、實時的定位視音頻傳輸, 以及低功耗以便攜等要求, 系統(tǒng)中采用了T I公司的TMS320DM642作為了采集器的主控芯片。DM642 是TI公司推出的一款專門面向多媒體應用的TMS320C6000 家族中性能最高的定點DSP, 具有8路并行的運算器、3個視頻專用和2個音頻復用接口, 集成10 /100Mbit / s以太網(wǎng)MAC。該芯片具有的這些優(yōu)點非常適合視音頻信息的采集、壓縮和傳輸。
圖1為采集器的硬件框圖。GPS定位數(shù)據(jù)通過串口由TL16C752B 讀入; 音頻信號由TLV320A IC23B以8 kH z, 16bit量化采樣; 視頻信號通過TVP5150采集。進入DM642 的定位數(shù)據(jù)一路通過低碼率的H 264視頻編碼后與G. 723的音頻編碼信號同步合成后, 通過無線網(wǎng)絡發(fā)送到遠程服務器, 另一路采用高碼率編碼后存儲到2. 5寸硬盤。
圖1 采集器硬件框圖
2 系統(tǒng)硬件設計
2. 1 視頻信號的采集
視頻信號的采集如圖2 所示, SCLK 為時鐘,GPCL為使能信號, Yout為8位BT. 656信號。系統(tǒng)中將DM642的VP0配置為VP0A + McASP模式, 其中VP0A 配置為8位BT. 656視頻輸入, 用來接一路視頻輸入。TVP5150PBS是一款高性能的視頻編碼器, 它將視頻信號模擬攝像頭輸出的NTSC /PAL模擬信號轉(zhuǎn)換成數(shù)字色差信號( YUV4: 2: 2), 輸出格式為ITU-R BT. 656。
圖2 視頻采集硬件框圖。
2. 2 音頻信號的采集
圖3為音頻輸入框圖, BCLK 為位時鐘, LRC IN和LRCOUT分別為幀同步輸入、輸出, D IN 和DOU分別為音頻輸入、輸出。McASP同時接入4路音頻輸入和輸出, 系統(tǒng)中將McASP設置為突發(fā)幀同步模式。TLC320A IC23B 為音頻編碼器件, 支持麥克風、立體聲輸入和立體聲輸出, 根據(jù)G. 723 編碼的要求, 話筒輸入的電信號通過TLC320A IC23B進行8 K采樣, 16比特量化。TLC320A IC23B 采用DSP模式與M cASP交換數(shù)據(jù)。
圖3 音頻采集硬件框圖。
2. 3 GPS信號的采集
圖4為GPS信號采集框圖, TX 和RX分別是串行數(shù)據(jù)發(fā)、收信號。TL16C752B 采用8位異步步行存儲器接口, 支持的波特率最高可達到1 Mbyte / s,與DM642的外部存儲器EM IFA 連接, 地址A 2 A0用于對TL16C752B 的8 個寄存器尋址。MAX3160是多協(xié)議收發(fā)器, 可以將串口接口電平配置為RS232 /RS422 /RS485 等多種接口電平標準。GPS采集模塊采用Ho lux M - 89, 它的靈敏度為159 dBm, 支援NMEA0183數(shù)據(jù)通訊協(xié)定, 其定位精度小于3 m, 高于S iRF芯片, 因此除了能很好完成高速移動定位, 更適合做步行等低速定位。
圖4 GPS采集硬件框圖。
2. 4 網(wǎng)絡數(shù)據(jù)的傳輸
網(wǎng)絡數(shù)據(jù)傳輸連接圖如圖5所示。DM642的網(wǎng)絡接口是與PCI、HPI復用的, 系統(tǒng)中通過PCI總線的B3和B10配置為HPI16+ 以太網(wǎng)接口。以太網(wǎng)接口由EMAC(網(wǎng)絡的數(shù)據(jù)通路)和MD IO( EMAC的狀態(tài)和控制接口)兩部分組成。系統(tǒng)中采用Broadcom 公司的BCM5221作為10 /100M 以太網(wǎng)的收發(fā)器(物理層)。
為實現(xiàn)無線網(wǎng)絡傳輸, 采用了3G路由器和無線網(wǎng)卡通過EVDO 網(wǎng)絡傳輸數(shù)據(jù)。3G 路由器采用Tenda 的3G611R, 該路由器兼容EVDO、HSPA、TD HSDPA三種3G網(wǎng)絡。無線網(wǎng)卡采用中興的AC2746, 該卡支持下行3. 1Mb it / s, 上行1. 8Mbit / s速率。
圖5 網(wǎng)絡傳輸硬件框圖
3 系統(tǒng)軟件設計
3. 1 總體流程圖
圖6為系統(tǒng)軟件流程圖。為了實現(xiàn)網(wǎng)絡的實時傳輸且保證后期的定位視音頻處理, 系統(tǒng)中采用了G. 723. 1音頻壓縮編碼、H. 264視頻壓縮編碼, GPS數(shù)據(jù)僅保留經(jīng)度、緯度、時間和高程四項數(shù)據(jù)以用于后期處理。由于G. 723的編碼是每30 ms一幀, 為實現(xiàn)視音頻和定位信息的同步, GPS間隔也設置為30 ms, 而實際的GPS 刷新速率為1次/ s, 因此需要通過經(jīng)緯度內(nèi)插的方式進行GPS 定位信息與視頻圖像的匹配。為壓縮視頻速率實現(xiàn)無線實時播放且實現(xiàn)視音頻的同步, 視頻編碼設置為90m s一幀, 視音頻編碼的對應關(guān)系為1:3。
圖6 系統(tǒng)軟件流程圖
3. 2 GPS數(shù)據(jù)的采集
系統(tǒng)中采用查詢方式讀取TL16C752B 中的GPS數(shù)據(jù), 由于GPS數(shù)據(jù)是循環(huán)不間斷發(fā)送, 軟件設計時利用了TL16C752B 緩存資源, 采用了間斷提取的方案以減小對DM642的占用。由于GPS數(shù)據(jù)傳輸速率設置為4 800 Baud, TL16C752B 的緩存為64字節(jié), 因此只要以小于133ms的時間間隔去讀取TL16C752B中的GPS數(shù)據(jù), 總能避免GPS 數(shù)據(jù)的覆蓋。由于編碼3幀G. 723. 1音頻的時間為90ms, 小于133ms, 因此每90ms讀取GPS數(shù)據(jù)1次, 讀取11~ 12次后就可以完整的讀完一組GPS數(shù)據(jù)。
3. 3 音視頻數(shù)據(jù)的采集和編碼
音頻數(shù)據(jù)的采集由M cASP完成, 將采集緩存長度設置為480字節(jié), 采集速率設置為8 kHz, 量化比特數(shù)設置為16 bi,t 則每30 ms將會返回一個采集緩存滿的標志, 通過查詢讀取該標志可以實現(xiàn)音頻數(shù)據(jù)的無丟失采集。視頻數(shù)據(jù)的采集由EDMA 完成,發(fā)送視頻采集指令后, 由EDMA 完成將視頻采集的原始視頻數(shù)據(jù)搬移到指定內(nèi)存。因此視音頻數(shù)據(jù)的采集都不會占用DM642 的資源。G. 723. 1 的音頻編解碼是將ITU T 的參考程序移植并優(yōu)化使用,經(jīng)測試優(yōu)化后的G. 723. 1的編碼時間小于5ms。
H264的視頻編碼采用Seed公司的H264庫, 該庫支持C IF( 352* 288) 100 kb it / s到800 kbit / s的編碼速率, D1( 704* 576) 500 kbit/ s到4 000 kbit/ s的編碼速率。程序中, 硬盤存儲采用D1、2. 4M 編碼,網(wǎng)絡傳輸采用C IF、300 kbit/ s編碼, 經(jīng)測試CIF 編碼時間小于5m s, D1編碼時間小于11m s。
3. 4 硬盤數(shù)據(jù)存儲
系統(tǒng)中采用的硬盤操作方式是直接輸入輸出方式( PIO), 為了防止每幀存盤占用過長的系統(tǒng)時間, 因此存盤任務采取了存盤緩沖的方案, 當緩沖區(qū)數(shù)據(jù)足夠大時, 方進行硬盤操作。為防止硬盤文件過大, 超出了FAT32的存儲范圍(小于4 Gbyte), 采取了當存盤文件大于800MB時, 重建一個序號相連的文件的方案。經(jīng)測試硬盤讀寫速度最高可達到11. 8Mbyte / s, 因此完全可以滿足系統(tǒng)存儲速度約為3Mbyte / s的要求。
3. 5.網(wǎng)絡數(shù)據(jù)傳輸
系統(tǒng)中的網(wǎng)絡操作采用T I公司的NDK 庫,該庫支持TCP、UDP、HTTP等常見的網(wǎng)絡協(xié)議。該庫的處理能力為每b it / s需要1. 66 個處理周期, 以300 kb it / s的平均傳輸速率計算, 每幀需要492 k個處理周期, 系統(tǒng)中DM642 運行速率為600 MH z, 則平均每幀發(fā)送時間為0. 82 ms。為了實現(xiàn)實時播放, 系統(tǒng)中以UTP 協(xié)議傳輸編碼后的數(shù)據(jù), TCP 協(xié)議傳輸網(wǎng)絡控制指令。
4 測試結(jié)果和結(jié)論
圖7為車載環(huán)境下的實時傳輸?shù)椒掌鞑@示的結(jié)果圖。系統(tǒng)測試采用了步行和車載兩種模式, 步行路線為南京師范大學1號門到3號門, 步行速度為5 km /h, 車載路線為南京師范大學1號門到中北校區(qū), 車載速度為60~ 80 km /h, 網(wǎng)絡傳輸采用江蘇電信的EVDO網(wǎng)絡。通過測試證明了該采集器能很好的采集存儲定位視音頻數(shù)據(jù), 在步行和車載環(huán)境下能通過EVDO網(wǎng)絡傳輸?shù)膶崟r傳輸定位視音頻數(shù)據(jù)。
圖7 測試結(jié)果圖
本采集器實現(xiàn)了定位視音頻的網(wǎng)絡直播, 提供一個更豐富及時的地理信息系統(tǒng)環(huán)境。除此外本采集器的采集數(shù)據(jù)可以為實景地圖和3D 場景地圖的構(gòu)建提供素材, 還可以實現(xiàn)基于地理定位信息的視音頻分割和檢索, 將極大的豐富地理信息系統(tǒng)的應用。