引言
數(shù)字技術(shù)的蓬勃發(fā)展和廣泛應(yīng)用使人類社會邁入了“數(shù)字時代”。今天,數(shù)字技術(shù)產(chǎn)品已走進普通百姓的日常生活之中。
賬 數(shù)字技術(shù)就是用數(shù)字編碼來描述和表達圖像、聲音等各種媒體信息。其信息處理的流程是:模擬信息→數(shù)字化→壓縮編碼→存儲或傳輸→解碼再現(xiàn)。其中,壓縮編碼是一個關(guān)鍵環(huán)節(jié)。數(shù)字化的圖像和聲音信號數(shù)據(jù)是非常龐大的,例如一幅640×480像素中等分辨率的彩色圖像(24 bit/像素)的數(shù)據(jù)量約為7.37 Mbit/幀,如果是運動圖像.以每秒30幀或者25幀的速度播放時,則視頻信號傳輸速率為220 Mbit/s;如果把這種信號存放在650MB的光盤中,一張光盤只能播放20多秒鐘。所以,必須對數(shù)字化信息進行壓縮.用盡可能少的數(shù)據(jù)來表達信息,節(jié)省傳輸和存儲的開銷。
1 視頻模型
數(shù)字視頻就是先用攝像機之類的視頻捕捉設(shè)備,將外界影像的顏色和亮度信息轉(zhuǎn)變?yōu)殡娦盘?,再記錄到儲存介質(zhì)(如錄像帶)。播放時,視頻信號被轉(zhuǎn)變?yōu)閹畔?。并以每秒約30幀的速度投影到顯示器上.使人類的眼睛認為它是連續(xù)不問斷地運動著的。電影播放的幀率大約是每秒24幀。如果用示波器(一種測試工具)來觀看,未投影的模擬電信號看起來就像腦電波的掃描圖像,由一些連續(xù)鋸齒狀的山峰和山谷組成。
中國和歐洲采用的是PAL制(逐行倒相制),美國和日本采用的NTSC制,PAL信號有25 fb/s的幀率,NTSC制信號有30 fb/s的幀率。視頻信號在質(zhì)量上可區(qū)分為復(fù)合視頻(Composite),S-Vide,YUV和數(shù)字(Digital)4個級別。復(fù)合視頻,VHS,VHS-C和VideO8都是把亮度、色差和同步信號復(fù)合到一個信號中,當(dāng)把復(fù)合信號分離時.濾波器會降低圖像的清晰度,亮度濾波時的帶寬是有限的,否則就會無法分離亮度和色差,這樣亮度的分離受到限制,對色差來講也是如此。因此復(fù)合信號的質(zhì)量比較一般,但他的硬件成本較低,目前普遍用于家用錄像機。S-Vide,S-VHS,S-VHS-C和Hi8都是利用2個信號表現(xiàn)視頻信號,即利用Y表現(xiàn)亮度同步,C信號是編碼后的色差信號,現(xiàn)在很多家用電器(電視機,VCD,SHVCD,DVD)上的S端子,是在信號的傳輸中,采用了Y/C獨立傳輸?shù)募夹g(shù),避免濾波帶來的信號損失。因此圖像質(zhì)量較好。YUV視頻信號是3個信號Y,U,V組成的,Y是亮度和同步信號.U,V是色差信號,由于無需濾波、編碼和解碼,因而圖像質(zhì)量極好,主要應(yīng)用于專業(yè)視頻領(lǐng)域。數(shù)字及同步信號利用4個信號:紅、綠、藍及同步信號加于電視機的顯像管,因此圖像質(zhì)量很高。還有一種信號叫射頻信號,他取自復(fù)合視頻信號.經(jīng)過調(diào)制到VHF或UHF,這種信號可長距離發(fā)送。現(xiàn)在電視臺就采用這種方式,通過使用不同的發(fā)射頻率同時發(fā)送多套電視節(jié)目。
2 數(shù)字化視頻采集
NTSC和PAL視頻信號是模擬信號,但計算機是以數(shù)字方式顯示信息的,因此NTSC和PAL信號在能被汁算機使用之前,必須被數(shù)字化(或采樣)。
模擬視頻信號攜帶了由電磁信號變化而建立的圖像信息.可用電壓值的不同來表示,比如黑自信號,O V表示黑.O.7 V表示白,其他灰度介于兩者之間。
數(shù)字視頻信號是通過把視頻幀的每個象素表現(xiàn)為不連續(xù)的顏色值來傳送圖像資料,并且由計算機使用二進制數(shù)據(jù)格式來傳送和儲存象素值.也就是對模擬信號進行A/D轉(zhuǎn)換后得到的數(shù)字化視頻信號。
數(shù)字視頻信號的優(yōu)點很多:
(1)數(shù)字視頻信號沒有噪聲,用0和1表示,不會產(chǎn)生混淆,而模擬信號要求屏蔽以減少噪聲。
(2)數(shù)字視頻信號可利用大規(guī)模集成電路或微處理器進行各類運算處理,而模擬信號只能簡單地對亮度、對比度和顏色等進行調(diào)整。
(3)數(shù)字視頻信號可以長距離傳輸而不產(chǎn)生損失,可以通過網(wǎng)絡(luò)線、光纖等介質(zhì)傳輸,很方便地實現(xiàn)資源共享,而模擬信號在傳輸過程中會產(chǎn)生信號損失。
一個視頻圖形適配器(通常叫做抓幀器或視頻采集卡)經(jīng)常被用來數(shù)字化視頻模擬信號,并將之轉(zhuǎn)換為計算機圖形信號。視頻信號的數(shù)字記錄需要大量的磁盤空間,例如,一幅640×480中分辨率的彩色圖像(24 b/pixel),其數(shù)據(jù)量約為O.92 Mb/s,如果存放在650 MB的光盤中,在不考慮音頻信號的情況下,每張光盤也只能播放24 s,使用如此巨大的磁盤空間存儲數(shù)字視頻,是大多數(shù)計算機用戶所無法接受的。在這種情況下,將視頻帶到計算機上,以有效的幀率播放存儲信息,是使用計算機處理視頻能力的最大障礙,鑒于此種情況,我們采用數(shù)據(jù)壓縮系統(tǒng)和幀尺寸、色彩深度和圖像精度折衷的辦法,對視頻數(shù)據(jù)進行壓縮,以節(jié)省磁盤存儲空間.?dāng)?shù)字化視頻采集技術(shù)也就變成了現(xiàn)實。
數(shù)字化視頻的過程.通常被叫做數(shù)字化視頻采集。模擬信號到數(shù)字信號的轉(zhuǎn)換中通常用8 bit來表示.對于專業(yè)或廣播級的信號轉(zhuǎn)換等級會更高。對于彩色信號,無論是RGB還是YUV方式,只需用24 bit來表示。因此采樣頻率的高低是決定數(shù)字化視頻圖像質(zhì)量的重要指標(biāo)。
視頻采集中計算機的處理設(shè)備通常有3種類型,即幀采集卡、動態(tài)圖像連續(xù)采集卡、電視節(jié)目接受卡。幀采集卡的工作原理是把偶合視頻信號解碼成RGB或YUV,RGB或YUV信號經(jīng)過A/D轉(zhuǎn)換后進入幀存體,幀存體內(nèi)的數(shù)據(jù)根據(jù)同步信號不斷被刷新。幀存體內(nèi)的數(shù)據(jù)需要保存時,計算機給出控制信號,幀存體數(shù)據(jù)不再被刷新.這時計算機可以讀出幀存體數(shù)據(jù)傳送到計算機內(nèi)存或存放到硬盤中。由于視頻信號是隔行掃描.在數(shù)字化過程中每幀圖像分成兩場,每場的分辨率是228行,因此高速運動的圖像采集后有抖動的感覺,要解決這一問題可以只采集一場或縮短快門時間。采集連續(xù)圖像到計算機中是比較困難的,因為單一幀靜止圖像的數(shù)據(jù)量已經(jīng)很大,而動態(tài)圖像是25幀/s~30幀/s,模擬的視頻圖像數(shù)字化后所得到的數(shù)據(jù)量巨大,使傳輸、存儲和處理很困難。解決這一問題的辦法一般有3種:
(1)利用局部數(shù)據(jù)總線,提高數(shù)據(jù)傳輸速度;
(2)大大降低分辨率;
(3)采用壓縮編碼。
3 視頻壓縮
對視頻圖像進行壓縮編碼,是目前最流行的方法。1980年以來,國際標(biāo)準(zhǔn)化組織(ISO)、國際電工委員會(IEC)和國際電信聯(lián)盟(ITU)等陸續(xù)完成了各種數(shù)據(jù)壓縮標(biāo)準(zhǔn)和建議.如面向靜止圖像壓縮的JPEG標(biāo)準(zhǔn),在運動圖像方面用于視頻會漢的H.261標(biāo)準(zhǔn)、用于可視電話的H.263標(biāo)準(zhǔn)、用于VCD的MlPEG1標(biāo)準(zhǔn)、用于廣播電視和DVD的MPEG2標(biāo)準(zhǔn)以及最新的采用基于對象的編碼理念的MPEG4標(biāo)準(zhǔn)等。MPEG是運動圖像專家組的英文首字母縮寫。該專家組成立于1988年,致力于運動圖像及其伴音的壓縮編碼標(biāo)準(zhǔn)化工作。
MPEG1于1993年成為國際標(biāo)準(zhǔn),它是對1.5 Mbit/s以下數(shù)據(jù)傳輸率的數(shù)字存儲媒體運動圖像及其伴音的壓縮編碼標(biāo)準(zhǔn),適用于CD—ROM、VCD、CD-I(交互式CD)等。
它可對SIF(標(biāo)準(zhǔn)交換格式)分辨率(NTSC制式為352×240;PAl,制式為352×288)的圖像進行壓縮,傳輸速率為L 5 Mbit/s,每秒播放30幀.具有CD音質(zhì),圖像質(zhì)量基本與VHS家用錄像機相當(dāng)。MPEGl也被用于數(shù)字通信網(wǎng)絡(luò)上的視頻傳輸,如基于ADSI。(非對稱數(shù)字用戶線路)的視頻點播(VOD)、遠程教育等。
MPEG2于1995年成為國際標(biāo)準(zhǔn),其目標(biāo)是達到高級工業(yè)標(biāo)準(zhǔn)的圖像質(zhì)量以及更高的傳輸率。MPEG2所能提供的傳輸率在3Mbit/s~10 Mbit/s之間,在NTSC制式下的分辨率可達720×486.可提供廣播級的圖像質(zhì)量和CD級的音質(zhì),適用于數(shù)字電視廣播(DVB)、HDTV和DVD的運動圖像及其伴音的壓縮編碼。目前,MPEG2已得到廣泛應(yīng)用.如美國、歐洲在DVD和數(shù)字電視廣播方面都采用MPEG2壓縮技術(shù)。
MPEG3最初是為HDTV開發(fā)的編碼和壓縮標(biāo)準(zhǔn),但由于MPEG2的出色性能表現(xiàn),已能適用于HDTV,使得MPEG3還沒出世就被拋棄了。
MPEG4于1999年初正式成為國際標(biāo)準(zhǔn)。MPEG4是一個適用于低傳輸速率應(yīng)用的方案。與MPEGl和MFPEG2相比,MPEG4更加注重多媒體系統(tǒng)的交互性和靈活性。在視頻編碼方面,MPEG4支持對自然和合成的視覺對象的編碼。合成的視覺對象包括2D、3D動畫和人面部表情動畫等。在音頻編碼,MPEG4是在一組編碼工具支持下,對語音、音樂等自然聲音對象和具有回響、空間方位感的合成聲音對象進行音頻編碼的。MPEG4音頻編碼不僅支持自然聲音,而且支持合成聲音。
MPEG4的重要特點包括:(1)基于內(nèi)容的普遍性。MPEG4能夠直接選取音頻、視頻內(nèi)容進行編碼,并對其靈活地進行控制和顯示,用戶可以自行選擇場景中的物體的解碼質(zhì)量,進行家庭影視節(jié)目制作和編輯。(2)以AV為對象.增強了交互性和擴展性,從而提高了交互應(yīng)用的靈活性。(3)將各種功能應(yīng)用在自然的和合成的AV對象上.增強了節(jié)目編輯制作能力。(4)MPEG4在誤碼環(huán)境中.尤其是在惡劣誤碼條件下的低比特率應(yīng)用中的抗誤碼性,有利于節(jié)目制作、分配和顯示。
4 結(jié)束語
視頻信號被采集到計算機后,就可進入編輯制作階段,由于硬盤錄像機、數(shù)字攝像機、非線性編輯系統(tǒng)等數(shù)字產(chǎn)品的快速發(fā)展,將視頻制作帶人全面數(shù)字化時代,視頻的網(wǎng)絡(luò)化傳輸和直接播出技術(shù)已成為現(xiàn)實。