超高清與 VR 技術(shù)”分論壇上,各巨頭分享超高清與 VR 前沿產(chǎn)品技術(shù)
3 月 30 日,AITech (2018 國際智能科技峰會) 于深圳隆重召開。本次峰會由深圳市人民政府指導(dǎo),深圳市龍崗區(qū)人民政府、中關(guān)村視聽產(chǎn)業(yè)技術(shù)創(chuàng)新聯(lián)盟、新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟主辦,深圳龍崗智能視聽研究院承辦。
在“超高清與 VR 技術(shù)”分論壇上,有來自學(xué)術(shù)界的科研大牛分享最新研究成果,也有行業(yè)標(biāo)準(zhǔn)制定者分享標(biāo)準(zhǔn)制定進(jìn)程,還有包括中國電信,阿里巴巴、飛利浦,三星等在內(nèi)的產(chǎn)業(yè)巨頭分享超高清與 VR 前沿產(chǎn)品技術(shù)。他們的共同主題是分享他們所看到的行業(yè)機(jī)遇、挑戰(zhàn)以及如何應(yīng)對新技術(shù)發(fā)展帶來的問題。以下是 AI 科技評論對論壇內(nèi)容的做的主要概述。
論壇的開始由廣電總局總工程師王效杰領(lǐng)導(dǎo)做開場致辭。她用非常幽默的開場白對 AVS 含義做了一個全新解釋。AVS(Audio Video coding Standard)不僅代表信源編碼標(biāo)準(zhǔn),A 還可以代表 AI,V 可以代表 VR,還可以代表虛擬現(xiàn)實(shí) VR 在這里召開了 AI 和 VR 會議。
王效杰領(lǐng)導(dǎo)在接下來表示,重新組建的國家廣播電視總局的一個主要職責(zé)就是推動廣播電視事業(yè)還有產(chǎn)業(yè)發(fā)展,總局會將一如既往的繼續(xù)支持新技術(shù)新標(biāo)準(zhǔn)的應(yīng)用和發(fā)展,也會攜手產(chǎn)業(yè)鏈共同推動超高清電視產(chǎn)業(yè)的加速發(fā)展。
接下來是嘉賓的正式分享環(huán)節(jié)。
第一位出場的是中國工程院丁文華院士,他分享的主題是中國超高清 HDR、3D Audio 標(biāo)準(zhǔn)及應(yīng)用。
丁文華院士首先分享了這兩年高清 4K 技術(shù)在中國的迅猛發(fā)展,無論是入戶數(shù)量還是 4K 智能設(shè)備都出現(xiàn)了爆發(fā)式的增長。2017 年,中國 4K 電視機(jī)的產(chǎn)量已經(jīng)突破了 3300萬,占全球4K電視機(jī)出貨量 40%以上。
2016 年 5 月份 ,按照工信部和廣電總局兩個部委的要求,AVS 技術(shù)應(yīng)用聯(lián)合推進(jìn)工作組開始推進(jìn)中國的超高清 HDR 和 3D audio 行標(biāo)及國標(biāo)的制作。 在整個標(biāo)準(zhǔn)的制作過程中,不可避免會遇到很多需要解決的問題。工作組首先是根據(jù)不同企業(yè)和組織的提案,做了相關(guān)技術(shù)點(diǎn)的分析,形成一個分析報告。在此基礎(chǔ)上安排了兩輪測試,第一輪測試不考慮編碼,只在 HDR 的前期生成。第二輪測試,加入編碼和解碼過程。嚴(yán)格的測試環(huán)節(jié)保證了行業(yè)標(biāo)準(zhǔn)能夠在真實(shí)環(huán)境中順利實(shí)施。此外,在一些重難點(diǎn)標(biāo)準(zhǔn)制定上,也采用了向全球征集方案的方法。在應(yīng)用層面,考慮到海外引進(jìn)內(nèi)容,也做了相關(guān)適配。
截止到今年三月。整個工作組已完成了 HDR 標(biāo)準(zhǔn)行標(biāo)的草案工作,已提交到廣電總局進(jìn)行審批。
丁文華院士最后做總結(jié):隨著 HDR 和 3D 標(biāo)準(zhǔn)的發(fā)展,會帶動新一輪面向超高清產(chǎn)業(yè)的發(fā)展,今年的下半年是一個很重要的部署年,制作端目前已經(jīng)沒有任何不可克服的障礙。希望產(chǎn)業(yè)界好好利用這段黃金期共同加速行業(yè)發(fā)展。
第二位出場的是現(xiàn)任浙江大學(xué)信息與通信網(wǎng)絡(luò)工程研究所長虞露,分享的主題為“AVS2 超高清編碼及后續(xù)標(biāo)準(zhǔn)計(jì)劃”
虞露在 2005 年至 2017 年任國家數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)工作組(AVS)視頻組組長,現(xiàn)任 MPEG 視頻組組長,主要研究領(lǐng)域包括視覺感知、視頻編碼、多媒體通信、專用集成電路設(shè)計(jì)等。在大會上,她依次分享了目前視頻高效編碼應(yīng)用現(xiàn)狀及需求,AVS2 超高清視頻編碼標(biāo)準(zhǔn)核心技術(shù),以及各組織視頻壓縮新標(biāo)準(zhǔn)計(jì)劃。
在談及視頻高效編碼的現(xiàn)狀及需求時,虞露教授引用了工信部發(fā)布的行業(yè)報告中的兩組數(shù)據(jù):
從智能設(shè)備的數(shù)量來看:2017 年,生成手機(jī) 19 億部,其中智能手機(jī) 14 億部。2017 年,生成彩色電視機(jī) 1.72 億臺,其中智能電視 1.09 億臺。
從網(wǎng)絡(luò)流量上來看:2017 年,固定數(shù)據(jù)及互聯(lián)網(wǎng)業(yè)務(wù)收入達(dá)到 1971 億元,移動互聯(lián)網(wǎng)接入流量消費(fèi)達(dá) 246 億GB,比上年增長 162.7%,移動互聯(lián)網(wǎng)接入流量達(dá)到 1775MB/月/戶,是上年的 2.3 倍。
從 2017 年分布的“思科視覺網(wǎng)絡(luò)指標(biāo)”可以預(yù)測未來視頻服務(wù)及內(nèi)容將持續(xù)成為網(wǎng)絡(luò)數(shù)據(jù)流量的主要來源。視頻急速發(fā)展帶來的問題也是顯而易見的,比如面臨巨大存儲問題,網(wǎng)絡(luò)寬帶問題等。因此迫切需要找到一種高效經(jīng)濟(jì)的編解碼技術(shù)。
接下來虞露教授對常見的三大視頻編碼標(biāo)準(zhǔn)組織(AVS、MPEG、VCEG)做了簡要介紹,并對其中的 AVS 視頻編碼標(biāo)準(zhǔn)發(fā)展歷程做了重點(diǎn)回顧。AVS 標(biāo)準(zhǔn)規(guī)定了碼流的語法,語義,以及解碼方法,對編碼方法沒有做具體規(guī)定,從而給企業(yè)和行業(yè)留下足夠大的發(fā)揮空間,面向不同的應(yīng)用類,創(chuàng)造差異化產(chǎn)品。
視頻編碼標(biāo)準(zhǔn)大概以十年為一個周期,逐代向前推進(jìn),AVS2 要比 AVS1 壓縮效率提高一倍。虞露教授透漏接下來任務(wù)是發(fā)展 AVS3,目標(biāo)是比 AVS2 的性能提升一倍以上,支持全景視頻的高效編碼等。
接下來的分享嘉賓是飛利浦中國研究院首席科學(xué)家馬縛龍,他分享的主題是先進(jìn) HDR 解決方案。
視頻發(fā)展的五個維度代表了未來產(chǎn)業(yè)對視頻理解的一個方向,它包括更高的分辨率,更高的幀率,亮的深度,高動態(tài)范圍和寬色域。飛利浦公司在高動態(tài)范圍圖像(HDR)領(lǐng)域一直保持著世界領(lǐng)先地位。
馬縛龍博士表示,HDR 有著更高的動態(tài)范圍,意味著有更高的對比度。值得注意的是,它和像素密度(也就是清晰度)是相獨(dú)立的,業(yè)界一直認(rèn)為這是下一代視頻的主流方向。
接下來馬縛龍對飛利浦和 technicolor 公司合作推出的先進(jìn) HDR(advanced-HDR)解決方案做了詳細(xì)介紹,包括了它的框架、技術(shù)細(xì)節(jié)和技術(shù)特點(diǎn)。它的技術(shù)特點(diǎn)是支持多種 HDR 格式的內(nèi)容,可應(yīng)用于各種前端專業(yè)設(shè)備及電視機(jī)、機(jī)頂盒等消費(fèi)電子設(shè)備。先進(jìn) HDR 的框架及技術(shù)細(xì)節(jié)的關(guān)鍵是動態(tài)元數(shù)據(jù)的生成和使用。
在實(shí)際廣播或直播中,飛利浦還提供了一種混合 HDR 直播解決方案。這種方案有兩大特點(diǎn),一是可以最大限度使用現(xiàn)有播出系統(tǒng)和網(wǎng)絡(luò)系統(tǒng),以盡可能降低成本。二是可以使用所有的 SDR 素材,包括以往視頻、插播廣告、圖文信息等。馬縛龍還介紹了一種能夠把 SDR 變成 HDR 的工具,叫做 ITM(Intelligent Tone Mapping )。他是一種專業(yè)調(diào)教工具,可以用于離線處理,也可以實(shí)時處理。
最后,馬縛龍對先進(jìn) HDR 的通用性和漸進(jìn)式、兼容性以及對寬帶和成本的節(jié)省做了總結(jié)。先進(jìn) HDR 可以兼容所有 HDR 策略,提供了從早期采用的 HDR10 標(biāo)準(zhǔn)到高品質(zhì)的漸進(jìn)式解決方案。它提供了單視頻流解決方案,避免必須專用 HDR 頻道節(jié)省了寬帶和成本。
第四位分享嘉賓是中國電信上海研究院視頻技術(shù)專家羅傳飛,他分享的主題是 IPTV 全 4K 及 AVS2 技術(shù)應(yīng)用。
羅傳飛先生表示,在未來五年,超高清產(chǎn)業(yè)將進(jìn)入發(fā)展黃金期。
中國電視是在 2014 年底開始 4K 視頻業(yè)務(wù)的實(shí)踐和探索。在實(shí)踐過程中,大家很快發(fā)現(xiàn)如果電視機(jī)尺寸不夠大,低于 60 寸,感受到的 4K 視頻體驗(yàn)提升不是很大。但 4K 視頻產(chǎn)業(yè)的嘗試意義非常重大,首先拉動了國內(nèi)芯片和終端產(chǎn)業(yè)繁榮發(fā)展,實(shí)際上也推動了運(yùn)營商的寬帶網(wǎng)絡(luò),基礎(chǔ)設(shè)施的更新和建設(shè)。
從 2017 年下半年開始,IPTV 產(chǎn)業(yè)基本完成全4K階段的基礎(chǔ)準(zhǔn)備,下一階段的提升方向和創(chuàng)新方法將圍繞 8K 視頻和 VR 技術(shù)來做。截止 2017 年底,4K 超高清發(fā)展情況是電信天翼高清用戶 9700 萬,移動魔百合 5700 萬,聯(lián)通沃電視達(dá) 3000 萬。并且可以預(yù)計(jì)這些數(shù)據(jù)還會持續(xù)增長。
接下來羅傳飛先生簡單梳理了超高清主流技術(shù)的幾個標(biāo)準(zhǔn)。包括超高清主流應(yīng)用標(biāo)準(zhǔn)組織;ITU、CCSA 等,超高清視頻編解碼標(biāo)準(zhǔn):AVS2.0、H.265等。HDR(高動態(tài)范圍)標(biāo)準(zhǔn)等:HDR10、HLG 等。
談及全 4K 的體驗(yàn)和定義,羅傳飛認(rèn)為體驗(yàn)要更具有真實(shí)感,更有沉浸感,更具普適性,更具操作性。全 4K 部署的核心是配合內(nèi)容產(chǎn)業(yè),終端顯示產(chǎn)業(yè)的發(fā)展和提升,發(fā)揮用戶不同電視的顯示能力,呈現(xiàn)最高的體驗(yàn)質(zhì)量。
全 4K 應(yīng)用標(biāo)準(zhǔn)關(guān)鍵技術(shù)的核心是在亮度、曲線、色域、位深、編解碼方式等的基本需求上與國內(nèi) HDR 行標(biāo)國標(biāo)保持一致等。全4K功能測試包括 6 個維度處理功能,10 比特輸出功能等,性能測試包括選擇十一個不同場景進(jìn)行整體層次感、通透度、流暢度、清晰度、顏色飽和度的主觀感受評測。
最后,羅傳飛等代表們集體上臺發(fā)布了最新的《IPTV業(yè)務(wù)系統(tǒng)AVS2實(shí)施指南》。
三星電子常務(wù) Yeong-Taeg Kim 發(fā)表了 HDR10+: the easiest way to bring high HDR quality over legacy platform 的主題分享。
Yeong-Taeg Kim 首先介紹 HDR10 +是通過傳統(tǒng)平臺實(shí)現(xiàn)高 HDR 質(zhì)量的最簡單方法。
首先,HDR10+ 很輕,只有幾十個元數(shù)據(jù),其次它是開源技術(shù),專利免費(fèi),許可證免費(fèi),三星與主要 DTV 芯片制造商共享核心 IP。
最后,他總結(jié) HDR10 +是向消費(fèi)者帶來 HDR 體驗(yàn)的一種簡單且經(jīng)濟(jì)高效的解決方案。由于貝塞爾曲線具有較高的自由度,靈活度,所以此方法也應(yīng)該可行。
三星將提供基于深度學(xué)習(xí)的 Basis OOTF 給 HDR10 +提供解決方案,這將為 HDR 電視中的 HDR 視頻帶來更愉悅的消費(fèi)體驗(yàn)。
接下來是北京大學(xué)深圳研究生院教授王榮剛出場,他發(fā)表的演講主題是虛擬現(xiàn)實(shí)視頻編碼標(biāo)準(zhǔn)進(jìn)展。
2015 年 12 月 5 號,VR 視頻編碼標(biāo)準(zhǔn) IEEE1857.9 正式獲得 IEEE 批準(zhǔn)立項(xiàng)。目標(biāo)是定義 VR 視頻緊湊表示和編碼方法,促進(jìn) VR 設(shè)備互聯(lián)互通,提升 VR 視頻壓縮效率。
2016 年 3 月,IEEE 1857 和 AVS 成立 VR 標(biāo)準(zhǔn)制定聯(lián)合工作組 VRU,共同制定 VR 國際標(biāo)準(zhǔn),先后有來自超過 150 家單位,300 多位專家來參與。
2018 年 3 月 28 日,《信息技術(shù)虛擬現(xiàn)實(shí)內(nèi)容表達(dá)第 2 部分:視頻》,通過了國家信標(biāo)委主任委員會議,正式進(jìn)入國標(biāo)委審批流程。
接下來,王榮剛對 VR 視頻標(biāo)準(zhǔn)框架,VR 視頻表示模型以及實(shí)驗(yàn)效果分別作了展示。在應(yīng)用方面,目前阿里云已實(shí)現(xiàn)了基于 AVS VR 的 VR 視頻系統(tǒng)。最后,他表示下一階段的標(biāo)準(zhǔn)工作是六自由度視頻表示、編碼與實(shí)時繪制。
優(yōu)酷 VR 技術(shù)專家盛曉杰帶來的專題分享是阿里優(yōu)酷 VR 應(yīng)用實(shí)踐。
首先,盛曉杰對阿里 VR 技術(shù)的實(shí)踐發(fā)展做了大致回顧。2016 年 5 月優(yōu)酷 VR 技術(shù)研發(fā)項(xiàng)目啟動,2017 年 8 月參加 AVS VR 會議,參與 VR 視頻編碼標(biāo)準(zhǔn)制定且相關(guān)提案被標(biāo)準(zhǔn)采納。2018 年 3 月,開始推進(jìn) VR 標(biāo)準(zhǔn)與阿里云服務(wù)結(jié)合。
接下來盛曉杰對 VR 技術(shù)的的采集端,云端,客戶端,標(biāo)準(zhǔn)四大核心技術(shù)點(diǎn)做了解讀,并從整體框架上對各部分所具有的功能做了介紹。最后他為大家做了幾個真實(shí)的 VR 案例展示,比如阿里巴巴年會,鄒市明拳擊賽,蝦米音樂節(jié)都用到了優(yōu)酷視頻 VR 技術(shù)。
最后一位分享嘉賓是來自博雅凌銳的首席專家張青,分享主題是人工智能技術(shù)產(chǎn)業(yè)化的探索與實(shí)踐。
張青先生將傳統(tǒng)產(chǎn)業(yè)與人工智能產(chǎn)業(yè)比作為“面包”和“葡萄干”,傳統(tǒng)產(chǎn)業(yè)越來越難做,以人工智能為代表的高科技產(chǎn)業(yè)勢頭猛進(jìn)。他為大家分享了進(jìn)入高科技產(chǎn)業(yè)的背后邏輯。
創(chuàng)業(yè)者的思維要發(fā)生變革。傳統(tǒng)思維是收入,成本,利潤,轉(zhuǎn)型,升級,做大,做強(qiáng)。而科技型企業(yè)的思維是:入口思維,渠道思維,生態(tài)思維,平臺思維。企業(yè)經(jīng)營方式也要變更。傳統(tǒng)企業(yè)是產(chǎn)品為王,而新型公司是模式為王,用戶為王。
在眾多的人工智能產(chǎn)品中,張青先生的分類是:引流型產(chǎn)品,會員型產(chǎn)品,兌付型產(chǎn)品,粘性產(chǎn)品,延伸性產(chǎn)品,組合產(chǎn)品。比如會員型產(chǎn)品就是幫助企業(yè)把所需要的智能模塊做出來,延伸性產(chǎn)品,比如刷臉手機(jī),蘋果手機(jī)等。
張青先生也分享了自己對人工智能產(chǎn)品的定價的看法,比如爆款的定價特點(diǎn)就是品質(zhì)極好,價格極低。在人工智能產(chǎn)品化的研究上,張青先生的有著自己非常獨(dú)到的見解。