數(shù)字電視與數(shù)字電視編碼技術(shù)的發(fā)展簡介
隨著廣播電視技術(shù)的發(fā)展和廣播電視設(shè)備的更新,電視領(lǐng)域發(fā)生了一系列巨大的變化,會(huì)議電視、VCD、DVD、數(shù)字電視以及高清晰度電視(HDTV)等新技術(shù)和新系統(tǒng)正迅速走進(jìn)我們的生活。與傳統(tǒng)的模擬電視相比,這些新系統(tǒng)的突出特點(diǎn)是采用了全數(shù)字的圖像/聲音處理技術(shù)。針對不同的應(yīng)用領(lǐng)域,一系列相應(yīng)的數(shù)字視頻音頻編碼標(biāo)準(zhǔn)也迅速地被制定并不斷得到完善,其中包括:應(yīng)用于會(huì)議電視及可視電話的H.261,用于靜止圖像壓縮的JPEG,用于VCD的MPEG-1、用于廣播電視、DVD以及HDTV的MPEG-2、用于網(wǎng)絡(luò)電視的MPEG-4等。與此同時(shí),數(shù)字演播室標(biāo)準(zhǔn)及數(shù)字電視的質(zhì)量評價(jià)標(biāo)準(zhǔn)也制定出來。
數(shù)字電視
數(shù)字電視可從節(jié)目內(nèi)容、技術(shù)角度和用戶角度來解釋。從用戶收視角度解釋,用戶采用IRD或數(shù)字電視接收機(jī)(DVB接口)收看的節(jié)目,方為真正意義上的數(shù)字電視節(jié)目;按節(jié)目內(nèi)容來源劃分,數(shù)字電視節(jié)目可以是電視節(jié)目,也可以是電影;從技術(shù)角度解釋,數(shù)字電視節(jié)目可以是以數(shù)字方式拍攝、制作、存儲(chǔ)、播出和傳輸?shù)碾娪昂碗娨暎部梢允且郧皫齑娴馁Y料片經(jīng)數(shù)字化處理所制成的電影和電視。
數(shù)字電視傳輸方式
數(shù)字電視節(jié)目可以在不同的傳播介質(zhì)中,采用不同的技術(shù)傳輸?shù)接脩艚邮斩?。?shù)字電視的傳輸手段主要有衛(wèi)星、地面發(fā)射、HFC網(wǎng)絡(luò)、SDH等,其中SDH主要用于數(shù)字電視節(jié)目的長距離傳輸。
由于我國的數(shù)字電視標(biāo)準(zhǔn)是在移植歐洲數(shù)字視頻廣播標(biāo)準(zhǔn)(DVB,由ISO/ICE 13818描述)的基礎(chǔ)上制定的,目前,正在推廣使用的有DVB-C,DVB-T,DVB-S三種。DVB-S(QPSK調(diào)制)為數(shù)字電視衛(wèi)星廣播采用;DVB-T(OFDM調(diào)制)為地面無線發(fā)射的數(shù)字電視廣播采用;DVB-C(QAM調(diào)制)為地面HFC網(wǎng)絡(luò)數(shù)字電視廣播采用。我國已完成了廣播電視衛(wèi)星傳輸?shù)臄?shù)字化改造,已經(jīng)形成了以DVB-S技術(shù)構(gòu)架的數(shù)字電視衛(wèi)星廣播網(wǎng),DVB-T的實(shí)驗(yàn)播出正在準(zhǔn)備之中,而作為數(shù)字電視廣播在國內(nèi)的主要覆蓋手段的DVB-C,已在開始在HFC網(wǎng)絡(luò)中大力推廣。
數(shù)字電視編碼技術(shù)
目前MPEG已頒布了四個(gè)活動(dòng)圖像及聲音編碼的正式國際標(biāo)準(zhǔn),分別稱為MPEG-1,MPEG-2,MPEG-4和MPEG-7。
1.MPEG-1編碼
MPEG-1標(biāo)準(zhǔn)是:在數(shù)字存儲(chǔ)介質(zhì)中實(shí)現(xiàn)對活動(dòng)圖像和聲音的壓縮編碼,編碼碼率最高為1.5Mb/s,標(biāo)準(zhǔn)的正式規(guī)范在ISO/IEC11172中。MPEG-1所支持的輸入圖像格式是SIF格式。SIF有525/625兩種格式:352×240×30和352×288×25。MPEG-1是一個(gè)開放的,統(tǒng)一的標(biāo)準(zhǔn),在商業(yè)上獲得了巨大的成功。盡管其圖像質(zhì)量僅相當(dāng)于VHS視頻的質(zhì)量,還不能滿足廣播級的要求,但已廣泛應(yīng)用于VCD等家庭視像產(chǎn)品中。
2.MPEG-2編碼
MPEG-2標(biāo)準(zhǔn)是:針對標(biāo)準(zhǔn)數(shù)字電視和高清晰度電視在各種應(yīng)用下的壓縮方案和系統(tǒng)層的詳細(xì)規(guī)定,編碼碼率3Mb/s~100Mb/s,標(biāo)準(zhǔn)的正式規(guī)范在ISO/IEC13818中。MPEG-2不是MPEG-1的簡單升級,MPEG-2在系統(tǒng)和傳送方面作了更加詳細(xì)的規(guī)定和進(jìn)一步的完善。MPEG-2特別適用于廣播級的數(shù)字電視的編碼和傳送,被認(rèn)定為SDTV和HDTV的編碼標(biāo)準(zhǔn)。MPEG-2還專門規(guī)定了多路節(jié)目的復(fù)分接方式。此外,MPEG-2還兼顧了與ATM信元的適配問題。
MPEG-2視頻編碼標(biāo)準(zhǔn)是一個(gè)分等級的系列,按編碼圖像的分辨率分成四個(gè)“級(Levels)”;按所使用的編碼工具的集合分成五個(gè)“類(Profiles)”。“級”與“類”的若干組合構(gòu)成MPEG-2視頻編碼標(biāo)準(zhǔn)在某種特定應(yīng)用下的子集:對某一輸入格式的圖像,采用特定集合的壓縮編碼工具,產(chǎn)生規(guī)定速率范圍內(nèi)的編碼流。
我們知道,當(dāng)前模擬電視存在著PAL,NTSC和SECAM三大制式并存的問題,因此,數(shù)字電視的輸入格式標(biāo)準(zhǔn)試圖將這三種制式統(tǒng)一起來,形成一種統(tǒng)一的數(shù)字演播室標(biāo)準(zhǔn),這個(gè)標(biāo)準(zhǔn)就是CCIR601,現(xiàn)稱ITU-RRec.BT601標(biāo)準(zhǔn)。MPEG-2中的四個(gè)輸入圖像格式“級”都是基于這個(gè)標(biāo)準(zhǔn)的。低級(Low Level)的輸入格式的像素是ITU-RRec.BT601格式的1/4,即352×240×30(代表圖像幀頻為每秒30幀,每幀圖像的有效掃描行數(shù)為240行,每行的有效像素為352個(gè)),或352×288×25。低級之上的主級(Main Level)的輸入圖像格式完全符合ITU-RRec.BT601格式,即720×480×30或720×576×25。主級之上為HDTV范圍,基本上為ITU-RRec.BT601格式的4倍,其中1440高級(High-1440Level)的圖像寬高比為4∶3,格式為1440×1080×30,高級(High Level)的圖像寬高比為16∶9,格式為1920×1080×30。
在MPEG-2的五個(gè)“類”中,較高的“類”意味著采用較多的編碼工具集,對編碼圖像進(jìn)行更精細(xì)的處理,在相同比特率下將得到較好的圖像質(zhì)量,當(dāng)然實(shí)現(xiàn)的代價(jià)也較大。較高類編碼除使用較低類的編碼工具外,還使用了一些較低類沒有使用的附加工具。因此,較高類的解碼器除能解碼用本類方法編碼的圖像外,也能解碼用較低類方法編碼的圖像,即MPEG-2的“類”之間具有后向兼容性。簡單類(Simple Profile)使用最少的編碼工具。主類(Main Profile)除使用所有簡單類的編碼工具外,還加入了一種雙向預(yù)測的方法。信噪比可分級類(SNR Scalable Profile)和空間可分級類(Spatially Scalable Profile)提供了一種多級廣播的方式,將圖像的編碼信息分為基本信息層和一個(gè)或多個(gè)次要信息層?;拘畔影瑢D像解碼至關(guān)重要的信息,解碼器根據(jù)基本信息即可進(jìn)行解碼,但圖像的質(zhì)量較差。次要信息層中包含圖像的細(xì)節(jié)。廣播時(shí)對基本信息層加以較強(qiáng)的保護(hù),使其具有較強(qiáng)的抗干擾能力。這樣,在距離較近,接收條件較好的情況下,可以同時(shí)收到基本信息和次要信息,恢復(fù)出高質(zhì)量的圖像;而在距離較遠(yuǎn),接收條件較差的條件下,仍能收到基本信息,恢復(fù)出圖像,不至造成解碼中斷。高級類(High Profile)實(shí)際上應(yīng)用于比特率更高,要求更高的圖像質(zhì)量時(shí),此外,前四個(gè)類在處理Y,U,V時(shí)是逐行順序處理色差信號的,高級類中還提供同時(shí)處理色差信號的可能性。
目前的標(biāo)準(zhǔn)數(shù)字電視采用的是MP@ML主類和主級,而HDTV采用的是MP@HL主類和高級。
3.MPEG-4編碼
MPEG-4標(biāo)準(zhǔn)是:視頻編碼經(jīng)歷了H.261、MPEG-1到MPEG-2的變遷。對廣播來說已經(jīng)是相當(dāng)完備的系統(tǒng)標(biāo)準(zhǔn),但對于通信和計(jì)算機(jī)應(yīng)用仍是不足。于是MPEG-4的系統(tǒng)層在原有ES流復(fù)用層(FlexMux)的基礎(chǔ)上擴(kuò)展了傳送復(fù)用層(TransMux),幾乎包括了所有多媒體、存貯媒體和通信的接口,如(RTP)UDP IP,PES MPEG-2 TS,AAL ATM,H223 PSTN,DABMux等等。使得MPEG-4的系統(tǒng)應(yīng)用極其廣泛。在信源方面,不是簡單地對連續(xù)的圖像和聲音進(jìn)行壓縮,而是對圖像和聲音進(jìn)行詳細(xì)的分解和描述,將計(jì)算機(jī)中“對象”(Objects)的概念引入MPEG-4,對音視頻對象和背景及文字分別進(jìn)行壓縮,甚至采用參數(shù)控制綜合合成的辦法還原圖像和聲音,使效率大大提高。如播音員臉部動(dòng)畫的綜合,文字到聲音的語音合成等,使解碼處理可擴(kuò)展到對象的縮放,具有a通道的對象透明度調(diào)整等復(fù)雜場景。也即除自然圖像外,增加了人工合成,創(chuàng)造和處理的痕跡。MPEG-4的類和級也有很大的變化,對視像內(nèi)容來說,分為自然視頻內(nèi)容,自然和合成混合圖像內(nèi)容兩部分。自然視頻內(nèi)容的類又分為五類:簡單視像類,用于移動(dòng)通信;簡單可分級視像類,用于有質(zhì)量分級的互聯(lián)網(wǎng)的軟件解碼;核心視像類,對簡單視像類補(bǔ)充任意形狀和隨時(shí)間縮放的對象的編碼,用于互聯(lián)網(wǎng)多媒體應(yīng)用;主視像類,對核心視像類補(bǔ)充隔行、半透明和子圖畫對象編碼,用于交互多媒體質(zhì)量的廣播和DVD的應(yīng)用;N-比特視像類,對核心視像類對象的樣本量化深度進(jìn)行調(diào)節(jié),可有4到12比特量化的核心視像類,用于監(jiān)視等應(yīng)用。對于合成的自然圖像混合視像內(nèi)容又有四類:簡單面部動(dòng)畫視像類、可分級紋理視像類、基本動(dòng)畫2D紋理視像類和混合視像類。圖形類共有兩類:2D圖形類和完全的圖形類。場景描述類共有五類:簡單場景類、2D場景類、虛擬現(xiàn)實(shí)模塊語言(VRML)場景類、音頻場景類和完全場景類。音頻的類型有:話音類、低碼率合成音頻類、可分級音頻類和主音頻類。級是對比特率、取樣率、圖像分辨率及復(fù)雜性進(jìn)行分級。不可能有沒有級的類,但有的類只有一級。 MPEG-4目前有了版本1、版本2,將包括以對象為基礎(chǔ)的空間可分級性。MPEG-4版本2應(yīng)用的例子是HomeNet Processing Laboratory 和逐行掃描清晰度電視編碼器,使用MPEG-4空間可分級對1080行 60幀逐行掃描高清晰度電視進(jìn)行編碼,MPEG-4空間可分級的性能通常優(yōu)于MPEG-2/4單層編碼,而且所需的幀存也要少12.5%,而且1080P很容易下變換到1080I和720P,該實(shí)驗(yàn)將高質(zhì)量1080P/60的傳輸碼率降至18Mb/s。
4.MPEG-7編碼
MPEG-7標(biāo)準(zhǔn)是:MPEG-7不是一個(gè)信源編碼標(biāo)準(zhǔn),而是有關(guān)內(nèi)容和對象的描述標(biāo)準(zhǔn),以便對內(nèi)容進(jìn)行更好的管理和再利用,這就要求對內(nèi)容做出準(zhǔn)確的描述,這就是元數(shù)據(jù)(Meta Data)。所謂元數(shù)據(jù)就是描述數(shù)據(jù)特性的數(shù)據(jù),因?yàn)樵趥鬏斚到y(tǒng)和處理系統(tǒng)看來,無論是視頻、音頻和數(shù)據(jù)都是數(shù)據(jù),必須加以描述。如SMPTE/EBU比特流節(jié)目素材交換協(xié)調(diào)標(biāo)準(zhǔn)是用來描述音視頻素材的,用于節(jié)目交換的內(nèi)容描述標(biāo)準(zhǔn)。MPEG-4中用于對象內(nèi)容識別的描述(OCI:Object Content Identifiers),用于音視頻數(shù)據(jù)庫用來描述各素材的數(shù)據(jù)等應(yīng)用。MPEG-7用來描述內(nèi)容的標(biāo)準(zhǔn),可分為正式元素和非正式元素兩部分。其正式的基本元素有:描述子(Descriptors)、描述方案(Description Schemes)、描述定義語言(Description)和編碼的描述(Coded Description)。非正式的基本元素有:描述子值(Descriptor Value)、特性(Features)、描述(Description)和編碼的描述(Coded Description)。目前的應(yīng)用主要有節(jié)目制作管理和節(jié)目資源的管理,數(shù)據(jù)庫中相關(guān)素材直到相關(guān)音視頻對象的檢索,業(yè)務(wù)端到終端交互業(yè)務(wù),版權(quán)識別,自生成數(shù)據(jù)庫等方面。元數(shù)據(jù)的制作和應(yīng)用將推進(jìn)節(jié)目制作工具的建設(shè)。離內(nèi)容稍微遠(yuǎn)一點(diǎn)是應(yīng)用編程接口(API:Application Programming Interface)。API是應(yīng)用程序是設(shè)備底層之間的接口,如一個(gè)機(jī)頂盒有CPU、輸入輸出器件、存儲(chǔ)器、圖形引擎、MPEG解碼等。這些底層的器件要通過傳送協(xié)議、虛擬機(jī)、瀏覽器等應(yīng)用軟件進(jìn)行控制,而應(yīng)用軟件則實(shí)現(xiàn)人機(jī)對話。機(jī)頂盒功能的實(shí)現(xiàn)及其應(yīng)用范圍都直接與API有關(guān),因此各國和各標(biāo)準(zhǔn)組織都非常重視。這方面最早的努力是MHEG(多媒體與超媒體信息編碼專家組),它是一種解釋語言,提供能用于機(jī)頂盒的對象的類,使其可以顯示經(jīng)常使用的形狀和文字,提供交互或定時(shí),或由一個(gè)場景連接到另一場景,或有一個(gè)場景的某一部分來啟動(dòng)某個(gè)應(yīng)用等。
了解和掌握數(shù)字電視的編碼技術(shù),是每一個(gè)電視工作人員必須熟悉的知識,特別是工程技術(shù)人員更應(yīng)該掌握電視技術(shù)的發(fā)展,用于更新觀念、熟悉設(shè)備、指導(dǎo)日常工作。