Tensilica 發(fā)布四款視頻處理引擎
Diamond Standard VDO 引擎在處理器上通過軟件方式來實現(xiàn)所有視頻關(guān)鍵處理的功能,包括網(wǎng)絡(luò)抽象層(network abstraction layer,)、圖像層、條代層(slice layer)、比特流解析、以及熵解編碼,包括在H.264 Main Profile解碼器中進行CABAC(Context-Adaptive Binary Arithmetic Coding)解碼。大多數(shù)其他解決方案都忽略了該功能,或采用獨立的復(fù)雜且不可編程的硬件模塊,或利用700MHz普通CPU來實現(xiàn)該功能(這種方法明顯增加功耗)。通過在指令集擴展中實現(xiàn)對CABAC的支持,Tensilica創(chuàng)造出一款低頻低功耗, 面積少于典型CABAC硬件一半的CABAC模塊。
Diamond VDO系列提供Baseline Profile和Main Profile兩種解決方案 –Main Profile提供更佳的數(shù)據(jù)壓縮率和視頻質(zhì)量,是面向高級手機和PMP應(yīng)用的D1或者更高分辨率的更好的編解碼機制。大多數(shù)其他的SoC視頻解決方案只實現(xiàn)Baseline Profile的視頻效果。
四款Diamond Standard VDO引擎可滿足多變的市場需求
Diamond 381VDO – 僅提供Baseline Profile和 Simple Profile的解碼,是主流手機、PMP和其他移動多媒體設(shè)備的理想選擇。該產(chǎn)品支持:
• H.264Decoder –Baseline Profile @ D1, 5 mbps, 30fps
• MPEG-4 Decoder–Simple Profile @ D1, 6 mbps, 30fps
• VC-1/WMV9 Decoder–Simple Profile @ D1, 6 mbps, 30fps
• MPEG-2 Decoder–Main Profile @ D1, 6 mbps, 30fps
Diamond 383VDO – 提供Baseline Profile和Simple Profile的解碼和編碼。
可支持Diamond 381VDO所支持的全部解碼器,以及MPEG-4Encoder–Simple Profile @ D1, 6 mbps, 30fps。
Diamond 385VDO – 僅提供核心Main Profile和ASP Profile的解碼器,是高級手機、PMP的理想選擇。該產(chǎn)品支持:
• H.264Decoder–Main Profile @ D1, 5 mbps, 30fps
• MPEG-4 Decoder–Advanced Simple Profile @ D1, 6 mbps, 30fps
• VC-1/WMV9 Decoder–Main Profile @ D1, 6 mbps, 30fps
• MPEG-2 Decoder –Main Profile @ D1, 8 mbps, 30fps
Diamond 388VDO – 提供Main Profile的解碼器和編碼器。除支持Diamond 385VDO所用的全部解碼器外,還支持MPEG-4Encoder–Advanced Simple Profile @ D1, 6 mbps, 30fps。
Tensilica總裁兼CEO Chris Rowen表示,“Tensilica已準(zhǔn)備好向那些將開發(fā)高品質(zhì)視頻產(chǎn)品的半導(dǎo)體制造商和系統(tǒng) OEM公司提供全部經(jīng)過測試的新產(chǎn)品解決方案。希望創(chuàng)造出象HiFi音頻引擎一樣的成功方案。HiFi音頻引擎已被廣泛應(yīng)用于數(shù)十款流行的手機設(shè)備中,其中包括摩托羅拉公司最新KRZR和RIZR手機。”
為開發(fā)新的Diamond Standard VDO系列,Tensilica采用了Xtensa®可配置且可擴展處理器技術(shù),創(chuàng)造了一個雙處理器的子系統(tǒng)模塊,包括一個集成DMA引擎,能以極低時鐘速率實現(xiàn)完整D1 Main profile的解碼和ASP編碼(完整的H.264 Main profile解碼僅需172MHz,而MPEG-4 Advanced Simple Profile (ASP)的解碼僅需156MHz)。
Diamond VDO雙核架構(gòu)包括基于Xtensa架構(gòu)配置得到的一個流處理器和一個像素處理器。流處理器指令集對視頻數(shù)據(jù)(熵解碼、運動向量的預(yù)測等等)的串行式處理進行了優(yōu)化。流處理器需要32K字節(jié)的本地數(shù)據(jù)存儲器,40K本地指令存儲器。其指令的寬度優(yōu)化到32位。像素處理器指令集采用SIMD(單指令多數(shù)據(jù))技術(shù),對像素數(shù)據(jù)的并行式處理進行了優(yōu)化。像素處理器需要40K本地數(shù)據(jù)存儲器,24K本地指令存儲器。處理器之間的內(nèi)部通信是通過一個128位的直連接口實現(xiàn)的,而外部視頻引擎接口通信是通過2個32位的總線實現(xiàn)的。
Tensilica在Diamond VDO系列中定義了400多條視頻專用指令,與通用DSP或通用32位微處理器相比,性能顯著提升。這些指令是針對視頻處理中性能要求苛刻的部分優(yōu)化得到的,這些算法部分包括:CABAC,它可得到H.264 Main profile視頻的更高壓縮效果;CAVLC(Context-adaptive variable-length coding),是一種用于H.264 Baseline Profile和 Main Profile的低復(fù)雜度壓縮算法;Deblocking:去塊效應(yīng),可減少在高壓縮視頻碼流中的由塊效應(yīng)所引起的失真;Transforms:各種變換(H.264中有很多種變換,在這是說支持多種變換)進行空間域的壓縮變換,類JPEG處理;運動補償和運動估計,用于在低速碼率條件下得到高質(zhì)量畫面的算法。
Tensilica針對新Diamond VDO引擎開發(fā)了編碼器和解碼器,客戶能直接從Tensilica購買到軟硬件完整的解決方案,SoC設(shè)計工程師不用依賴第三方應(yīng)用提供商。
Tensilica同時提供全套與之適配的軟件開發(fā)工具鏈,包括一個基于ECLIPSE框架的高級集成開發(fā)環(huán)境、一個世界級編譯器、一個周期精確(cycle-accurate)并兼容SystemC的指令集仿真器、以及完整的工業(yè)標(biāo)準(zhǔn)GNU工具鏈。另外,Tensilica廣泛的合作伙伴網(wǎng)絡(luò)提供操作系統(tǒng)、調(diào)試工具、ICE解決方案、以及其他有助于將Tensilica處理器快速設(shè)計進其產(chǎn)品中的支持。
新Diamond VDO引擎相比與基于硬件的視頻加速器和常規(guī)CPU結(jié)合的傳統(tǒng)方式會相當(dāng)受歡迎。首先,Diamond VDO IP核減少了系統(tǒng)主控CPU的全部視頻解碼任務(wù)– 包括全部比特流解析。傳統(tǒng)的硬件加速器僅可減少如運動估計那樣的像素處理工作,而將大部分計算負擔(dān)(經(jīng)常需要100MHz的持續(xù)的主控CPU開銷)交由系統(tǒng)控制器來完成。
第二,傳統(tǒng)解決方案包括了一個CPU和一個硬件加速器,當(dāng)數(shù)據(jù)通過系統(tǒng)總線在CPU和加速器間進行傳輸時會產(chǎn)生大量的功耗 –通常出于方便,其他方案不計算這部分功耗,這樣使得他們宣稱的硬件加速器模塊本身的消耗很低。
第三,當(dāng)Diamond VDO引擎沒有被用于進行視頻處理時,可隨時以一種相當(dāng)于有500多 Dhrystone MIPS處理能力的通用CPU 來執(zhí)行其他系統(tǒng)任務(wù) – 相反一個特定的視頻硬件模塊是不能被重用的。
第四,Diamond VDO引擎是可編程的,因此可支持今后出現(xiàn)的視頻標(biāo)準(zhǔn)。
最后,Diamond VDO引擎面積小,其面積在130nm工藝下僅有8mm2(包括處理器邏輯和內(nèi)部存儲器)。
Diamond Standard VDO系列針對移動應(yīng)用而優(yōu)化,比其他競爭產(chǎn)品具有更小面積、更低的功耗。通過運用Xtensa處理器的一種特征-細粒度門控時鐘再結(jié)合可編程的電源管理指令(可以降低各種負載情況下視頻處理的功耗),其動態(tài)功耗被降至最低。進一步的能耗利用率的提升是通過DMA引擎和流處理器與像素處理器間的接口實現(xiàn),而后者令外部存儲器帶寬要求降至最低。在節(jié)省面積方面,例如,Diamond 383VDO,其面積包括存儲器僅占10 mm2;全功能Diamond 388VDO可在D1分辨率下,提供完全的H.264 Main profile解碼和MPEG-4 ASP編碼的支持,而其包括存儲器的面積僅有 12 mm2,且在TSMC 0.13G工藝技術(shù)下運行速度為200MHz。