解讀音視頻技術(shù)的發(fā)展趨勢
2016年,即構(gòu)推出了全球首創(chuàng)的直播連麥技術(shù),用自研的技術(shù),在不改造基點(diǎn)網(wǎng)絡(luò)、不改造任何場景的情況下,后臺(tái)服務(wù)器和前端引擎做到1到1.5秒的低延遲,在極低延遲下支持更多主播連麥。技術(shù)推出后,吸引了國內(nèi)過半大型的直播平臺(tái),引入連麥的方式來豐富直播場景,“直播”和“連麥”也自然而然成了即構(gòu)的標(biāo)簽。
“QQ”是因?yàn)榧礃?gòu)團(tuán)隊(duì)很多人來自QQ團(tuán)隊(duì),在騰訊待了超過10年的人很多,包括我自己。我們當(dāng)時(shí)在騰訊主要做兩個(gè)事情,一是花了五年來重構(gòu)整個(gè)QQ的客戶端,二是花了五年做了QQ的音視頻引擎,在這兩個(gè)五年中,我們獲得了億萬級(jí)用戶通訊產(chǎn)品技術(shù)經(jīng)驗(yàn)。
2015年,從騰訊出來后,我們成立了即構(gòu)。一開始我們就選擇了一條最難的路:基于公有云開放的架構(gòu),重新自研音視頻引擎和后臺(tái)服務(wù),開放技術(shù)去幫助企業(yè)做業(yè)務(wù)產(chǎn)品的開發(fā),而不是為了省事而采用開源的代碼。這樣做成功率很低,花費(fèi)的人力成本也很高。之所以這么硬氣,是因?yàn)槲覀僀TO金建忠和技術(shù)骨干,很多從大學(xué)開始就做音視頻相關(guān)的技術(shù),到現(xiàn)在有超過18年的技術(shù)積累。
因?yàn)槲覀冏匝械囊粢曨l引擎,用了比較好的架構(gòu)設(shè)計(jì),在軟件層做到了同時(shí)支持多方通訊,2017年3月,即構(gòu)推出了32路視頻通話技術(shù),在當(dāng)時(shí)是業(yè)內(nèi)首家,并且有了落地的應(yīng)用,比今年6月蘋果發(fā)布的FaceTime支持32路早了整整一年。
從創(chuàng)立以來,即構(gòu)就專注做技術(shù),事實(shí)證明,大家是愿意為好的技術(shù)買單的。在成立后三年多的時(shí)間里,即構(gòu)得到了騰訊、花椒、映客、咪咕、好未來、喜馬拉雅等500+家各行各業(yè)客戶的信任,包括老東家騰訊。隨著接觸到的客戶越來越多,在行業(yè)里發(fā)展的越來越深,我們發(fā)現(xiàn),音視頻技術(shù)的應(yīng)用場景遠(yuǎn)比想象中的多,應(yīng)用規(guī)模也越來越大。
直播是音視頻技術(shù)沉淀多年后得到的初步應(yīng)用,也讓大家意識(shí)到:音視頻技術(shù)不僅局限用于會(huì)議系統(tǒng)這樣的商業(yè)領(lǐng)域,也不僅僅是社交群聊,還能用在直播。而在直播中又延伸出如秀場直播、多主播連麥、直播相親、直播答題、K歌合唱等泛娛樂直播場景。
泛娛樂直播無法忽視的是游戲直播,設(shè)備和網(wǎng)絡(luò)的發(fā)展讓游戲能支持更大的碼率傳輸,音視頻的介入,狼人殺、棋牌游戲等桌游線上化時(shí)更真實(shí),玩MOWAA游戲、吃雞、王者榮耀時(shí)語音溝通也讓游戲更社交化,未來,音視頻功能將會(huì)是游戲直播的標(biāo)配,同時(shí),越來越多游戲往社交化發(fā)展。
其中還延伸出彩票直播這種新奇的玩法,用戶直接在線上購買彩票,即買即刮,直播兌獎(jiǎng),不再像以前一樣需要到彩票點(diǎn)購買。除了泛娛樂直播,音視頻技術(shù)還能用在在線教育、金融、公檢法、民生各種領(lǐng)域,還能跟各種硬件結(jié)合,實(shí)現(xiàn)不同的玩法。
在線教育不算是新場景,今年因?yàn)榧夹g(shù)發(fā)展和環(huán)境的改善,還有教育機(jī)構(gòu)的投入和運(yùn)營,有很多種應(yīng)用場景,如1對(duì)1、1對(duì)多的小班課堂,跨國小班、雙師課堂、音樂陪練等。有個(gè)明顯的改變就是體制內(nèi)K12的中小學(xué)開始擁抱新技術(shù),很多已經(jīng)開始采用雙師課堂的形式,實(shí)現(xiàn)了優(yōu)質(zhì)老師的共享。在學(xué)校推動(dòng)和政府支持下,硬件發(fā)展也很快,像錄播機(jī)、觸控屏、黑板也改造成適應(yīng)雙師課堂的場景。
在線金融方面,視頻開戶、視頻客服、視頻投資顧問、視頻雙錄很多證券公司和銀行已經(jīng)有在用了;企業(yè)級(jí)的又有企業(yè)直播、視頻會(huì)議、呼叫中心、賽事直播等等,今年的世界杯和亞運(yùn)會(huì)直播,咪咕直播就使用了即構(gòu)的云導(dǎo)播臺(tái),不用專業(yè)的直播機(jī)器,就能快速地實(shí)現(xiàn)導(dǎo)播直播,融入更多互聯(lián)網(wǎng)自由的元素。
公檢法也可以接入音視頻技術(shù),實(shí)現(xiàn)可視化執(zhí)法、遠(yuǎn)程接訪、視頻庭審。民生政務(wù)方面,可以通過小程序接入技術(shù),實(shí)現(xiàn)視頻辦事。即構(gòu)6月給海淀工商分局做的平臺(tái),就讓用戶在小程序上通過視頻通話就能咨詢和辦理業(yè)務(wù),以往來幾趟才弄好的事情現(xiàn)在幾分鐘就能搞定。
除了單一線上的支持,音視頻技術(shù)也可以跟軟硬件結(jié)合,形成一站式解決方案。拿線上抓娃娃機(jī)為例,線上涉及到APP/H5,線下涉及到一系列的娃娃機(jī)硬件,娃娃機(jī)要對(duì)接到互聯(lián)網(wǎng)有很大障礙。去年娃娃機(jī)風(fēng)口時(shí),很多客戶折騰了幾個(gè)月,都沒做起來。為了方便客戶,即構(gòu)直接在線下還建立了娃娃機(jī)房,將技術(shù)、軟件、硬件全鏈條串起來,形成了一站式抓娃娃軟硬件解決方案,客戶只管專心做線上用戶運(yùn)營,其他全部由即構(gòu)搞定。
我們也能看到,越來越多的智能硬件產(chǎn)品開始接入音視頻技術(shù),像無人機(jī)、車聯(lián)網(wǎng)、機(jī)器人、智能眼鏡等,兩者結(jié)合后又能應(yīng)用到不同的行業(yè)。以智能眼鏡為例,能應(yīng)用在鐵路、電力、水利的巡檢,巡檢過程中和在辦公室的專家遠(yuǎn)程互動(dòng),指導(dǎo)操作;同樣的場景可以用在汽修廠、公安執(zhí)法、銀行導(dǎo)購當(dāng)中。
然而,在接觸客戶的過程中,我們發(fā)現(xiàn)很多客戶排斥接入一個(gè)新技術(shù),覺得技術(shù)和新場景結(jié)合起來非常痛苦,需要開發(fā)團(tuán)隊(duì)需要對(duì)原有業(yè)務(wù)進(jìn)行改造,而這個(gè)改造的動(dòng)作,造成了產(chǎn)品業(yè)務(wù)體驗(yàn)的差異,后續(xù)開發(fā)新的產(chǎn)品就有可能返工重造,擴(kuò)展很不平滑,用戶感受也不愉快,這種其實(shí)就是有形的技術(shù)。
我們要做的是將技術(shù)無縫融合到業(yè)務(wù)場景中,通過業(yè)務(wù)與技術(shù)結(jié)合,推動(dòng)產(chǎn)品的持續(xù)發(fā)展,來增強(qiáng)用戶的體驗(yàn),而不是讓其變得更差,用戶在體驗(yàn)的時(shí)候是感受不到技術(shù)的,能感受到的是產(chǎn)品越來越好,用起來很愉快。
要真正把一個(gè)技術(shù)無形融合到產(chǎn)品當(dāng)中,必須要下苦功。即構(gòu)在三方面做了努力,一是堅(jiān)持以技術(shù)驅(qū)動(dòng),自研音視頻引擎,將80%的精力放在技術(shù)研發(fā)上。二是將技術(shù)從點(diǎn)做到面,從提供標(biāo)準(zhǔn)化的SDK,到提供全棧式的解決方案。三是以用戶體驗(yàn)為導(dǎo)向,配置1對(duì)1咨詢顧問,通過和客戶深入交流產(chǎn)品應(yīng)用的細(xì)節(jié),及時(shí)收集解決問題,來不斷打磨技術(shù)服務(wù)。
目前,即構(gòu)已經(jīng)服務(wù)了500+企業(yè)用戶,覆蓋了100+國家和地區(qū),鏈接全球5億+的終端用戶。技術(shù)無形融入各行各業(yè)后,線上方式還原線下溝通場景,將幫助企業(yè)實(shí)現(xiàn)之前無法實(shí)現(xiàn)的場景,提高用戶體驗(yàn),讓產(chǎn)品有更大的創(chuàng)新空間,也推動(dòng)了整個(gè)社會(huì)高效地工作,加速全球資源共享和技術(shù)共享。