高清晰視頻通訊應(yīng)用技術(shù)
隨著視頻通訊應(yīng)用技術(shù)的不斷發(fā)展和完善,越來越多的行業(yè)用戶接受和使用視頻通信產(chǎn)品。但在傳統(tǒng)視頻通訊技術(shù)標(biāo)準(zhǔn)下,由于受到視頻通訊應(yīng)用技術(shù)和音視頻編解碼技術(shù)發(fā)展的制約,視頻通訊技術(shù)到現(xiàn)在還沒有從根本上解決通訊過程中的圖像和聲音問題。
低等級的視頻質(zhì)量無法滿足用戶對高清晰圖像質(zhì)量的特殊需求。
傳統(tǒng)視頻通訊的主要問題是:經(jīng)過編解碼后的圖像在解析度、色彩還原度等方面和真實(shí)場景有較大的差距。造成這一現(xiàn)象的原因方面是由于編解碼設(shè)備的編解碼效率低、鏈路動態(tài)適應(yīng)能力差等諸多因素導(dǎo)致對真場景還原失真。另外在音頻方面,傳統(tǒng)的50Hz-7KHz只能感受到較窄的音頻寬度并不能對現(xiàn)場環(huán)境和聲音特征進(jìn)行有效還原,需要音頻編解碼提供更高的音頻采樣率,以實(shí)現(xiàn)更寬的音頻效果。在現(xiàn)實(shí)運(yùn)用中,人們對于視頻的圖像和聲音的要求越來越高,例如:遠(yuǎn)程醫(yī)療、遠(yuǎn)程手術(shù);遠(yuǎn)程維修等需要通過視頻通訊這一過程實(shí)現(xiàn)對現(xiàn)場情況的精確視頻傳輸(高清晰視頻應(yīng)用)。所以就需要我們提供更高視頻通訊質(zhì)量的高清晰視頻通訊產(chǎn)品。因此數(shù)碼視訊公司推出了基于標(biāo)準(zhǔn)的H.320;H.323的高清晰視頻通訊產(chǎn)品NEWVISION 7000
、NEWVISION 8000系列。
高清晰視頻通訊技術(shù)的選擇:
視頻要求:
視頻通訊應(yīng)用作為一種媒體應(yīng)用方式同樣需要遵循各標(biāo)準(zhǔn)組織所倡導(dǎo)的高清晰多媒體標(biāo)準(zhǔn)。當(dāng)前高清晰數(shù)字電視(HDTV)所倡導(dǎo)的視頻解析度主要有三種格式,分別為720P、1080I、1080P (其中“P”為逐行掃描方式;“I”為隔行掃描方式)。而高清晰視頻通訊主要應(yīng)用格式為:720P——即逐行720線。
視頻通訊采用逐行掃描的原因在于,視頻會議場景通常對動態(tài)圖像要求不大(特殊領(lǐng)域除外),圖像動態(tài)變化也較小,但對圖像的細(xì)節(jié)要求卻很高,同時還要保證圖像的穩(wěn)定性。而這些都是采用隔行掃描1080i(PAL制每秒鐘掃描50場,分別對水平方向的奇數(shù)行和偶數(shù)行進(jìn)行掃描,每場的實(shí)際解析度僅有540線)所無法滿足的,因此在掃描方式上采用逐行掃描,能夠更穩(wěn)定的顯示畫面的細(xì)節(jié),使得畫面更加清晰。
在媒體流處理方面,需要將大量的原始視頻音頻數(shù)據(jù)流進(jìn)行編碼壓縮后在傳輸鏈路上進(jìn)行壓縮傳輸。高清晰音視頻流(720P)所處理的視頻流是傳統(tǒng)CIF格式流的10倍。如果采用更大解析度格式的視頻圖像,如1080P,會造成原始媒體數(shù)據(jù)流更為巨大,從而影響視頻編碼效率,降低通訊過程的實(shí)時性,增加延遲,同時也是對圖像實(shí)時壓縮技術(shù)的考驗。因此,視頻會議系統(tǒng)的建設(shè),無論是建設(shè)標(biāo)清還是高清晰視頻通訊系統(tǒng)都要綜合考慮用戶對系統(tǒng)建設(shè)的投資,讓用戶付出相對較低的成本,得到最大的收益。采用過高的視頻圖像格式(1080P)進(jìn)行媒體流的處理,這樣對DSP的成本會增加,同時也會相應(yīng)造成用戶整體成本的增加,例如視頻會議系統(tǒng)的周邊配套設(shè)備——高清晰顯示設(shè)備、回放設(shè)備、存儲設(shè)備和主要的攝像采集設(shè)備,都要符合高清晰通訊的規(guī)程(高清晰視頻通訊是一個完整的端到端的系統(tǒng)),而這些設(shè)備的價格都遠(yuǎn)超其他設(shè)備,會使得整體成本大幅提升,從而給用戶所能帶來的實(shí)際效果提升卻并不明顯。因此,采用720P視頻格式作為圖像解析度的格式能夠使整體系統(tǒng)達(dá)到最佳的性價比,能夠有效的降低用戶的采購成本,避免投資浪費(fèi)。
在圖像的幅面顯示方面,目前高清晰顯示設(shè)備均可以同時支持4:3和16:9兩種顯示方式。傳統(tǒng)視頻通訊系統(tǒng)多數(shù)采用4:3顯示方式,而高清晰視頻通訊在視頻格式幅型比上應(yīng)采用更為符合人眼觀賞習(xí)慣的16:9的顯示方式來替代傳統(tǒng)視頻會議系統(tǒng)采用的4:3的顯示方式,這是因為屏幕顯示區(qū)域在垂直解像度(線數(shù))相同的情況下,采用16:9顯示方式可視面積比4:3顯示方式的可視面積要增加20%左右,單幀畫面可容納更多的視頻信息,這樣視頻通訊中用戶就可以獲得更大角度的視頻圖像。
所以綜述得出結(jié)論是:在對高清晰視頻通訊視頻圖像的最佳選擇應(yīng)該是:選擇720P視頻格式、16:9幅面的高清晰視頻標(biāo)準(zhǔn)。
音頻要求:
視頻通訊過程是視頻和音頻的實(shí)時雙向完整通訊過程。在這個過程中我們?yōu)榱双@得高清晰視頻圖像,有時卻忽略了另外一個重要的過程——音頻通訊過程。如果我們在觀看高清晰視頻圖像的時候,不能得到一個更清晰、連續(xù)的音頻效果。那么這個過程實(shí)際上就沒有任何意義,所以其重要性甚至超過視頻。在傳統(tǒng)的視頻會議系統(tǒng)中音頻技術(shù)發(fā)展極其緩慢,原因在于目前應(yīng)用于視頻通訊的音頻編解碼壓縮標(biāo)準(zhǔn)都是為了保持傳輸時的低帶寬占用和較高的編解碼效率,從而將音頻信號的采樣頻率、采樣精度和采樣范圍指標(biāo)做了極大的降低,使得所能提供的音頻清晰度和還原性都有很大程度上的衰減。與用于存儲和回放非實(shí)時壓縮協(xié)議的標(biāo)準(zhǔn)(如OGG、MP3等)相比,音頻的保真度非常低。這樣就在某種程度上對現(xiàn)場聲音的還原達(dá)不到要求。目前傳統(tǒng)視頻通訊過程中主要采用的是G.711、G.722、G.722.1、G.728等音頻標(biāo)準(zhǔn),音頻寬度僅有50Hz-7KHz單聲道,而人耳所能感知的自然界的頻響能力可以達(dá)到20Hz-20KHz,因此,在對現(xiàn)場環(huán)境音的還原過程中過多的音頻信息的丟失造成了無法真實(shí)表現(xiàn)現(xiàn)場情況。所以在高清晰視頻通訊過程中我們勢必要有一種相輔助的音頻處理方式解決此問題。使真?zhèn)€高清晰通訊過程更去近于完美。