基于STi7105的視頻通話功能的實(shí)現(xiàn)
本文以STi7105 高清機(jī)頂盒為基礎(chǔ),采用SIP 協(xié)議,盡量利用高清互動(dòng)機(jī)頂盒的現(xiàn)有編解碼能力實(shí)現(xiàn)視頻通話功能。該方案充分利用了機(jī)頂盒的現(xiàn)有模塊及HFC 網(wǎng)絡(luò),但是對(duì)語(yǔ)音和視頻的壓縮度不高。隨著科學(xué)技術(shù)特別是多媒體通信技術(shù)的發(fā)展,傳統(tǒng)的語(yǔ)音電話模式越來(lái)越不能滿足現(xiàn)代人之間信息交流的需求。隨著圖像、音頻、視頻等多媒體數(shù)據(jù)逐漸成為信息處理領(lǐng)域中的主要媒體表現(xiàn)形式,與傳統(tǒng)語(yǔ)音電話相比,視頻電話可以更加吸引用戶,并可以有效地利用網(wǎng)絡(luò)資源,大大降低成本。有線電視網(wǎng)絡(luò)在業(yè)務(wù)上已經(jīng)實(shí)現(xiàn)視頻、數(shù)據(jù)業(yè)務(wù),為適應(yīng)我國(guó)大力推進(jìn)"三網(wǎng)融合"的步伐,必須能夠?qū)崿F(xiàn)通信業(yè)務(wù),所以實(shí)現(xiàn)視頻通話是一項(xiàng)很好的選擇。
1 STi7105 芯片簡(jiǎn)介
STi7105 是意法半導(dǎo)體公司生產(chǎn)的一款高性能高清數(shù)字電視機(jī)頂盒解碼芯片,采用先進(jìn)的半導(dǎo)體生產(chǎn)工藝及完善的優(yōu)化設(shè)計(jì),提升各個(gè)功能模塊的性能,增加高速數(shù)據(jù)接口,降低耗電量,降低系統(tǒng)的整體材料成本。STi7105 是一款應(yīng)用范圍很廣的SoC 芯片,可以用于有線高清數(shù)字電視機(jī)頂盒、衛(wèi)星高清數(shù)字電視機(jī)頂盒、IPTV 機(jī)頂盒、多媒體手持設(shè)備等。STi7105 芯片的結(jié)構(gòu)示意圖如圖1。
圖1 STi7105 示意圖
STi7105 芯片內(nèi)部集成了一顆高性能的ST40 應(yīng)用程序處理器,主頻高達(dá)450MHz,實(shí)時(shí)處理運(yùn)算能力超過(guò)800DMIPS,另外芯片內(nèi)還集成有兩顆實(shí)時(shí)運(yùn)算加速器,也可以用于各種運(yùn)算要求的處理。這樣的處理能力不但可以達(dá)到高清機(jī)頂盒的要求,還能夠充分滿足家庭多媒體中心的設(shè)計(jì)需求。
STi7105 的TS 流輸入處理模塊可以支持4 路TS流輸入、1 路TS 流輸出,這個(gè)處理模塊內(nèi)可以同時(shí)處理分解多個(gè)碼流,用于同時(shí)進(jìn)行錄像、碼流回放、畫(huà)中畫(huà)等功能,這些碼流可以來(lái)自傳統(tǒng)的數(shù)字電視廣播通道,也可以來(lái)自Cable Modem、EoC、以太網(wǎng)等IP 通道,該模塊能為用戶提供靈活的產(chǎn)品開(kāi)發(fā)模式。
STi7105 集成了高性能的視音頻解碼器,其靈活的解碼架構(gòu)可以滿足目前已有的各種視音頻編碼壓縮格式的解碼要求,也可以通過(guò)軟件升級(jí)來(lái)支持這些標(biāo)準(zhǔn)。在視頻編解碼方面, 它可以支持H.264HP@HL4.1、MPEG -2 MP@HL、VC -1 MP@HL、AP@L3、MPEG -4 P2 ASP@L5、DiVx 格式、RM、RMVB、AVS 等視頻格式,其解碼器可以用于PVR、畫(huà)中畫(huà)功能,支持1080p 的格式,內(nèi)置的圖像降噪聲處理,增強(qiáng)優(yōu)化的后處理電路能夠給用戶帶來(lái)前所未有的優(yōu)美圖像。在音頻編解碼器方面,可以支持MPEG-1 layer I/II、MP3、MPEG -2 layer II、AC -3 DolbyDigital、DD+、AAC、AAC+SBR 等等,也可支持杜比、DTS 的新算法及中國(guó)DRA 音頻標(biāo)準(zhǔn)。
STi7105 除視音頻解碼功能以外,還具有一定的視音頻的編碼的能力,支持DivX、XviD、H.263 編碼格式。
2 實(shí)現(xiàn)及應(yīng)用
2.1 技術(shù)協(xié)議
視頻通話終端軟件的開(kāi)發(fā)和應(yīng)用涉及許多方面的技術(shù),包括信令協(xié)議、分組語(yǔ)音技術(shù)、視頻編解碼技術(shù)以及流媒體網(wǎng)絡(luò)傳輸技術(shù)等。
2.1.1 信令協(xié)議
信令指各個(gè)交換局在完成呼叫接續(xù)中的一種通信語(yǔ)言,在通信設(shè)備之間傳遞的各種控制信號(hào),如占用、釋放、設(shè)備忙閑狀態(tài)、被叫用戶號(hào)碼等,都屬于信令。信令系統(tǒng)指導(dǎo)系統(tǒng)各個(gè)部分相互配合,協(xié)同運(yùn)行,共同完成某項(xiàng)任務(wù)。目前國(guó)際上IP 網(wǎng)絡(luò)通信的主要標(biāo)準(zhǔn)有H.323 和SIP (Session Initiation Protocol),兩者都對(duì)視頻電話系統(tǒng)信令提出了完整的解決方案,都是作為多媒體通信的應(yīng)用層控制(信令)協(xié)議,都利用RTP 作為媒體傳輸協(xié)議。但是兩者的設(shè)計(jì)風(fēng)格截然不同,H.323 采用的是傳統(tǒng)的電話信令模式,包括一系列協(xié)議;而SIP 借鑒其他互聯(lián)網(wǎng)協(xié)議,采用基于文本的協(xié)議。
SIP 協(xié)議由于其簡(jiǎn)單、易于擴(kuò)展、便于實(shí)現(xiàn)等諸多優(yōu)點(diǎn)越來(lái)越得到通信業(yè)界的青睞,SIP 在現(xiàn)有通信網(wǎng)向NGN 演進(jìn)過(guò)程中十分重要,正在成為NGN(下一代網(wǎng)絡(luò))的核心協(xié)議之一,而且SIP 協(xié)議已經(jīng)被3GPP工作組定義為第三代移動(dòng)通信系統(tǒng)的信令協(xié)議以提供IP 多媒體服務(wù),本方案采用SIP 作為信令協(xié)議。
SIP 協(xié)議是IETF 制訂用于多方多媒體通信,主要目的是為了解決IP 網(wǎng)中的信令控制以及同軟交換機(jī)的通信,從而構(gòu)成新一代的通信平臺(tái)。SIP 協(xié)議采用客戶機(jī)/服務(wù)器的工作方式,SIP 網(wǎng)絡(luò)包含兩類組件:用戶代理(User Agent)和網(wǎng)絡(luò)服務(wù)器(Network Server)。
用戶代理(UA)表示一個(gè)終端系統(tǒng),包括用戶代理客戶端(UAC)和用戶代理服務(wù)器端(UAS),前者產(chǎn)生請(qǐng)求,后者產(chǎn)生對(duì)應(yīng)的響應(yīng)。UAC 和UAS 是邏輯上的兩個(gè)部分,每個(gè)終端系統(tǒng)都包含了UAC 和UAS 的功能。
SIP 是一個(gè)分層體系結(jié)構(gòu)的協(xié)議,第1 層是語(yǔ)法和編碼層,它的編碼使用擴(kuò)展的巴科斯范式規(guī)定;第2 層是傳輸層, 它定義了網(wǎng)絡(luò)上的客戶機(jī)和服務(wù)器如何接收請(qǐng)求和發(fā)送響應(yīng);第3 層是事務(wù)層,事務(wù)是SIP的基本元素,事務(wù)由客戶機(jī)向服務(wù)器發(fā)送的請(qǐng)求和從服務(wù)器發(fā)回客戶機(jī)的所有響應(yīng)組成,事務(wù)層若處理消息超時(shí),則重傳并匹配響應(yīng)到請(qǐng)求;第3 層是用戶層,每個(gè)SIP 實(shí)體(除了無(wú)狀態(tài)代理)都是事務(wù)用戶,當(dāng)一個(gè)事務(wù)用戶希望發(fā)送請(qǐng)求時(shí),就創(chuàng)建一個(gè)客戶機(jī)事務(wù)實(shí)例以發(fā)送此請(qǐng)求。SIP 提供用戶定位、用戶通信能力協(xié)商、用戶可用性、建立呼叫和呼叫處理與控制等功能。SIP 不提供具體的業(yè)務(wù),不定義會(huì)話將如何描述,只提供會(huì)話建立功能。SIP 協(xié)議清晰地將會(huì)話建立和會(huì)話描述區(qū)分開(kāi),使SIP 可以成為Internet 上多媒體會(huì)話中真正意義上的信令協(xié)議,適用范圍很廣。
2.1.2 視頻編碼技術(shù)
視頻壓縮是多媒體應(yīng)用中的核心技術(shù),ITU-T 推出的低碼率視頻壓縮標(biāo)準(zhǔn)對(duì)推動(dòng)可視電話的發(fā)展和實(shí)用化起到了重要的促進(jìn)作用。H.261 是ITU-T 推出的第一個(gè)低碼率視頻壓縮標(biāo)準(zhǔn),碼率為P×64kbps,其中P 在1~30 中取值,圖像格式為CIF 和QCIF.H.261壓縮編碼算法的基本思想是利用預(yù)測(cè)編碼減少時(shí)間冗余度,利用變換編碼減少空間冗余度。算法主要由運(yùn)動(dòng)估計(jì)、運(yùn)動(dòng)補(bǔ)償、DCT 變換、量化和霍夫曼編碼構(gòu)成。
H.263 是最早用于低碼率視頻編碼的ITU-T 標(biāo)準(zhǔn),隨后出現(xiàn)的第二版(H.263+)及H.263++增加了許多選項(xiàng),使其具有更廣泛的適用性。H.263 是ITU-T為低于64kb/s 的窄帶通信信道制定的視頻編碼標(biāo)準(zhǔn)。
它是在H.261 基礎(chǔ)上發(fā)展起來(lái)的,其標(biāo)準(zhǔn)輸入圖像格式可以是S-QCIF、QCIF、CIF、4CIF 或者16CIF 的彩色4∶2∶0 亞取樣圖像。H.263 與H.261 相比采用了半像素的運(yùn)動(dòng)補(bǔ)償,并增加了4 種有效的壓縮編碼模式。
H.264 是由ISO/IEC 與ITU-T 組成的聯(lián)合視頻組(JVT)制定的新一代視頻壓縮編碼標(biāo)準(zhǔn)。對(duì)信道時(shí)延的適應(yīng)性較強(qiáng),既可工作于低時(shí)延模式以滿足實(shí)時(shí)業(yè)務(wù),又可工作于無(wú)時(shí)延限制的場(chǎng)合。在編解碼器中采用復(fù)雜度可分級(jí)設(shè)計(jì),在圖像質(zhì)量和編碼處理之間可分級(jí),以適應(yīng)不同復(fù)雜度的應(yīng)用,提高網(wǎng)絡(luò)適應(yīng)性。相對(duì)于先期的視頻壓縮標(biāo)準(zhǔn),H.264 引入了很多先進(jìn)的技術(shù),包括4×4 整數(shù)變換、空域內(nèi)的幀內(nèi)預(yù)測(cè)、1/4 像素精度的運(yùn)動(dòng)估計(jì)、多參考幀與多種大小塊的幀間預(yù)測(cè)技術(shù)等。
H.261 與H.263 在視頻通信中應(yīng)用較廣,H.263 與H.261 相比,增加了若干選項(xiàng),提供了更靈活的編碼方式,壓縮效率大大提高,更適應(yīng)網(wǎng)絡(luò)傳輸。H.264 標(biāo)準(zhǔn)的推出,是視頻編碼標(biāo)準(zhǔn)的一次里程碑式的重要進(jìn)步,它與H.263、H.261 相比,具有明顯的優(yōu)勢(shì),特別是編碼效率的提高,使之能用于許多新的領(lǐng)域。由于STi7105 芯片視頻編碼能力有限,所以我們視頻編碼選用H.263 格式。
2.1.3 音頻編碼技術(shù)
語(yǔ)音通信是可視電話最基本的功能,受網(wǎng)絡(luò)條件的限制,可視電話通常在較低碼率下工作。ITU-T 推出了一系列語(yǔ)音壓縮標(biāo)準(zhǔn),其中有G.711、G.723.1、G.
728、G.729 和G.729A 等,在可視電話中得到了廣泛應(yīng)用。當(dāng)可視電話與普通電話通信時(shí),采用G.711 標(biāo)準(zhǔn),G.711 為PCM 編碼,只對(duì)語(yǔ)音信號(hào)進(jìn)行采樣和量化,產(chǎn)生64kbps 的碼流,G.711 編碼后的語(yǔ)音質(zhì)量高,缺點(diǎn)是占用的帶寬也很高。G.723.1 能夠產(chǎn)生兩種速率的碼流,高速率編碼器使用多脈沖最大自然量化(MP-MLQ)算法,低速率編碼器使用代數(shù)碼激勵(lì)線性預(yù)測(cè)(ACELP)算法。G.729A 是G.729 的簡(jiǎn)化版本,其復(fù)雜度與G.729 相比降低了50%,語(yǔ)音質(zhì)量略有降低,兩種標(biāo)準(zhǔn)編碼后的碼流可互相解碼。
實(shí)際選擇語(yǔ)音編解碼算法時(shí),要考慮各種因素,高比特率可以保證良好的語(yǔ)音品質(zhì),但要占用大量存儲(chǔ)空間,耗費(fèi)更多資源;而過(guò)低的比特率會(huì)影響語(yǔ)音的品質(zhì)增加延遲。由于STi7105 芯片音頻處理能力有限,所以我們音頻編碼選用G.711、G.723.1 格式。
2.2 系統(tǒng)結(jié)構(gòu)
視頻通話測(cè)試系統(tǒng)主要由服務(wù)器、傳輸網(wǎng)絡(luò)和STi7105 機(jī)頂盒終端組成,架構(gòu)如圖2 所示。
圖2 系統(tǒng)結(jié)構(gòu)示意圖
服務(wù)器用來(lái)控制整個(gè)系統(tǒng)的通話過(guò)程,服務(wù)器的基本功能是按照用戶的要求完成對(duì)信令、視頻、話音等信號(hào)切換,保證音頻及視頻的連續(xù)性。