一對(duì)一語音聊天場(chǎng)景的技術(shù)難點(diǎn)是什么

時(shí)間：2020-05-20 15:57:02

關(guān)鍵字：網(wǎng)絡(luò) 音視頻語音通話 TV

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] （文章來源：布谷鳥網(wǎng)絡(luò)科技）視頻聊天時(shí)候，因?yàn)榭梢钥吹奖舜耍瑢?duì)聲音也不那么在意。而純語音聊天時(shí)，人注意力都放在聲音上，對(duì)音質(zhì)的要求更高。 1)整體穩(wěn)定的技術(shù)，1 對(duì) 1 語聊的

（文章來源：布谷鳥網(wǎng)絡(luò)科技）

視頻聊天時(shí)候，因?yàn)榭梢钥吹奖舜?，?duì)聲音也不那么在意。而純語音聊天時(shí)，人注意力都放在聲音上，對(duì)音質(zhì)的要求更高。

1)整體穩(wěn)定的技術(shù)，1 對(duì) 1 語聊的技術(shù)門檻相對(duì)較低，多人語聊和特定場(chǎng)景相對(duì)復(fù)雜，技術(shù)實(shí)現(xiàn)難度比較大。以pia戲?yàn)槔绻?jīng)常出現(xiàn)卡頓、延遲和聽不清的情況，會(huì)將營造的劇情氣氛破壞殆盡，主播時(shí)不時(shí)要退出重新登錄，無法全身心投入，用戶聽到的是斷斷續(xù)續(xù)的聲音，不能沉浸到劇情中。

自研的音視頻引擎，通過抖動(dòng)緩沖技術(shù)、前向糾錯(cuò)技術(shù)、丟幀補(bǔ)償技術(shù)減少網(wǎng)絡(luò)抖動(dòng)和弱網(wǎng)環(huán)境下的延遲，保障語音通話低延時(shí)且清晰。讓用戶在復(fù)雜網(wǎng)絡(luò)環(huán)境和多類型手機(jī)的情況下，也能實(shí)現(xiàn)暢通優(yōu)質(zhì)的語音通話。

2)多人聊天的語音前處理，以KTV語聊房為例，在房間當(dāng)中，有人說話聲音、歌聲、伴奏都在房間呈現(xiàn)，每個(gè)人所處的地方，所用的設(shè)備也不一樣，這就有很大可能出現(xiàn)回聲、噪音，或是某個(gè)人設(shè)備不是很好，發(fā)出的聲音很小。

成熟的語音前處理3A技術(shù)：回聲消除(AEC)、噪音抑制(ANS)、音量增益(AGC)，杜絕回聲和嘯叫，降噪而無損音質(zhì)。這樣歌者能展示甜美歌聲，聽眾也有良好的聽覺享受。

3)媒體次要信息同步，而在KTV類的場(chǎng)景中，AB兩人輪麥合唱，如果輪到B唱歌時(shí)發(fā)現(xiàn)歌詞沒同步，就很難唱下去。這當(dāng)中技術(shù)難點(diǎn)就在于歌詞等媒體次要信息是否能做到同步。支持將非媒體信息注入媒體流中，歌詞等媒體次要信息和音視頻信息放在同一個(gè)媒體通道傳輸?shù)模龅礁柙~與歌聲同步展示果。