高清話質(zhì)-無(wú)與倫比的VoIP話質(zhì)
還記得第一次收聽(tīng)調(diào)頻收音機(jī)嗎?還記得在多年收聽(tīng)磁帶之后第一次收聽(tīng)CD嗎?高清話質(zhì)電話為我們帶來(lái)的就是這樣的感受。隨著VoIP的不斷商用化,系統(tǒng)開(kāi)發(fā)商和服務(wù)供應(yīng)商的重點(diǎn)也由提供VoIP服務(wù)轉(zhuǎn)向提供更高質(zhì)量的VoIP服務(wù)。借助高清電視的強(qiáng)大營(yíng)銷(xiāo)攻勢(shì),目前HD-sound已經(jīng)成為被廣泛接受的寬帶語(yǔ)音品牌。這使服務(wù)供應(yīng)商能夠通過(guò)自己的IP電話家用網(wǎng)關(guān)提供清晰的音質(zhì)。傳統(tǒng)的“窄帶”電話在語(yǔ)音清晰度和數(shù)據(jù)傳輸速率方面實(shí)現(xiàn)了折中,聲音帶寬為300Hz~3.4kHz。相比之下,HD-sound采用了寬帶技術(shù),傳輸帶寬為50Hz~7.0kHz或者更高。這不僅大大提高了通話的清晰度和自然度,而且還大大提高了MP3和網(wǎng)絡(luò)收音機(jī)等其他多種音頻應(yīng)用的語(yǔ)音清晰度和自然度。本文試圖闡述電話實(shí)現(xiàn)高清話質(zhì)所面臨的障礙,并說(shuō)明其市場(chǎng)潛力。
高清語(yǔ)音:寬帶電話
“寬帶”電話的傳輸帶寬范圍為150Hz~6.3kHz。盡管這不是CD帶寬(20Hz~20kHz),但與窄帶相比,增加的寬帶大大提高了語(yǔ)音的清晰度。大約20年前,寬帶電話曾針對(duì)采用G.722編解碼器的ISDN實(shí)現(xiàn)了標(biāo)準(zhǔn)化,但從未真正獲得廣泛部署。不過(guò)G.722在新聞?lì)I(lǐng)域卻得到了應(yīng)用,G.722寬帶經(jīng)常被用于從遙遠(yuǎn)的地點(diǎn)傳輸語(yǔ)音,代替語(yǔ)音質(zhì)量較差的標(biāo)準(zhǔn)電話。
由于IP電話已具備針對(duì)窄帶語(yǔ)音壓縮算法的強(qiáng)大信號(hào)處理功能,因此可輕易通過(guò)IP電話的語(yǔ)音引擎來(lái)處理寬帶編解碼器,若模數(shù)轉(zhuǎn)換器和數(shù)模轉(zhuǎn)換器支持16kHz采樣率,則IP電話上的寬帶電話只需相對(duì)較低的額外開(kāi)銷(xiāo)。其他推動(dòng)寬帶電話發(fā)展的因素還包括全新的DECT標(biāo)準(zhǔn)CAT-iq,該標(biāo)準(zhǔn)還指定 G.722為高清語(yǔ)音所需的編解碼器。
PC聲卡支持8kHz、16 kHz、32kHz、44.1kHz和48kHz的采樣率,通常具備寬帶編解碼器所需的處理功率?!癝kype”等基于PC的軟電話應(yīng)用已在市場(chǎng)廣泛部署。多數(shù)企業(yè)的IP電話(如西門(mén)子的OpenStage系列)已經(jīng)支持寬帶。企業(yè)寬帶市場(chǎng)就是這種理念的出色證明,原因是更容易控制終端的硬件和軟件。寬帶需要通話雙方都具備能夠處理寬帶的硬件,話機(jī)立即轉(zhuǎn)至可用的最佳編解碼器。
過(guò)去,VoIP不得不面臨性能不可靠的問(wèn)題。早期只有勇敢的先驅(qū)敢于通過(guò)網(wǎng)絡(luò)建立語(yǔ)音連接,而目前寬帶用戶已紛紛快速采用語(yǔ)音服務(wù)供應(yīng)商提供的全新產(chǎn)品。以前,電話在音質(zhì)和價(jià)格方面不得不進(jìn)行折中。今天,VoIP音質(zhì)前所未有地大幅度提升,可輕松與POTS(簡(jiǎn)單老式電話)服務(wù)媲美。由于客戶端設(shè)備的可用帶寬和處理功率正逐步實(shí)現(xiàn)標(biāo)準(zhǔn)化,因此采用更高的帶寬大幅提高音質(zhì)就顯得非常實(shí)際和刻不容緩。這是供應(yīng)商提供特色服務(wù)的解決之道。VoIP不再僅僅是VoIP。HD-Sound使它成為物超所值的暢銷(xiāo)技術(shù)。POTS電話通話與HD-Sound通話相比,不僅聲音更細(xì),而且基本保持一個(gè)聲調(diào)。HD Sound可提供“更加溫暖”的通話,能捕捉到我們語(yǔ)音當(dāng)中所有細(xì)微差別?,F(xiàn)在將S誤聽(tīng)為F的經(jīng)歷早已成為歷史。HD Sound可將話音質(zhì)量提高幾倍。目前將該技術(shù)向更廣大的用戶推廣還存在許多相關(guān)問(wèn)題。
圖1 傳輸頻譜圖
在頻譜分析圖表中,我們很容易看到HD-Sound具備較大的傳輸頻譜范圍。HD-Sound的傳輸頻譜包括比窄帶電話傳輸頻譜更低和更高的音調(diào),使寬帶通話者能夠獲得非常出色的用戶體驗(yàn)。
圖2對(duì)MOS(平均意見(jiàn)得分)值的分析深刻說(shuō)明了寬帶是如何被主觀感知的。窄帶G.729A的多數(shù)MOS值約為 3.5,而高清語(yǔ)音的MOS值至少比其高出30%,達(dá)到4.5。
圖2 窄帶與寬帶編解碼器的平均意見(jiàn)得分
要想優(yōu)化寬帶的部署,話機(jī)廠商(固話和無(wú)繩電話)必須遵守一些重要的規(guī)定:電聲組件,尤其是電話聽(tīng)筒或免提揚(yáng)聲器必須能夠在各自的裝置內(nèi),以較低的失真度和較高的逼真度重新生成寬帶的整個(gè)頻率范圍。這將為設(shè)備設(shè)計(jì)者,尤其是無(wú)繩話機(jī)或手機(jī)等小型設(shè)備的設(shè)計(jì)者帶來(lái)巨大挑戰(zhàn)。一流的音質(zhì)需要付出成本,但巨大的市場(chǎng)將會(huì)帶來(lái)額外助益。
建議將免提電話封裝起來(lái),目的是避免室內(nèi)的回聲和增強(qiáng)低頻效果,例如被完全封閉起來(lái)的家用高保真揚(yáng)聲器。任何VoIP電話(窄帶或?qū)拵В┰趯?shí)現(xiàn)全雙工性能時(shí),最難解決的是時(shí)延問(wèn)題。人耳對(duì)話音后的回聲是不敏感的,否則我們無(wú)論在任何室內(nèi)都將聽(tīng)到很強(qiáng)的回聲。但是話音與回聲之間的時(shí)延越長(zhǎng),人耳對(duì)回聲的感知就會(huì)更加靈敏。這就是我們?cè)诮烫媚軌蚴冀K聽(tīng)到回聲的原因。標(biāo)準(zhǔn)IP網(wǎng)絡(luò)分組時(shí)延可能會(huì)超過(guò)100ms——相當(dāng)于一個(gè)大教堂的時(shí)延。因此需要額外采取措施減少回聲。消除話機(jī)內(nèi)的回聲如同消除進(jìn)入耳內(nèi)的回聲一樣。通過(guò)估計(jì)、計(jì)算和減少麥克風(fēng)信號(hào)產(chǎn)生的回聲,達(dá)到取消回聲的目的。這是一項(xiàng)非常艱難的工作,因?yàn)樗仨氝m用于話機(jī)存在的任何環(huán)境。
高清語(yǔ)音幫助拓展市場(chǎng)
高清語(yǔ)音為系統(tǒng)廠商和服務(wù)供應(yīng)商進(jìn)入全新的市場(chǎng)提供了大量機(jī)會(huì)。
1交互式語(yǔ)音響應(yīng)
您能想象利用預(yù)先錄制的語(yǔ)音樣本,借助通話服務(wù)預(yù)定機(jī)票嗎?一定很難想象得到。目前的主要語(yǔ)音激活服務(wù)幾乎讓人發(fā)瘋,它們甚至無(wú)法辨別培訓(xùn)話語(yǔ)的輕微增量。采用寬帶技術(shù)可以更加輕松地捕獲人類(lèi)語(yǔ)音的細(xì)微差別,使語(yǔ)音激活服務(wù)成為潛力巨大的可行服務(wù)。在不必與任何人講話的情況下,我們不僅可升級(jí)寬帶或話機(jī)服務(wù),而且可預(yù)定機(jī)票、酒店或火車(chē)票。語(yǔ)音識(shí)別系統(tǒng)也將受益于不斷增加的帶寬,提供更加出色的識(shí)別率,尤其是更加出色地識(shí)別齒擦音。(齒擦音是我們講話時(shí)發(fā)出的S音,因此在窄帶通話中,常常會(huì)把F字母誤聽(tīng)為S字母)
2文本-語(yǔ)音轉(zhuǎn)換(TTS)
系統(tǒng)將標(biāo)準(zhǔn)語(yǔ)言文本轉(zhuǎn)化成語(yǔ)音(采用合成語(yǔ)音)。語(yǔ)音合成器的質(zhì)量是通過(guò)合成語(yǔ)音與人類(lèi)語(yǔ)音的相似度和可理解度評(píng)定的。易懂的文本-語(yǔ)音轉(zhuǎn)換程序可使視障人士或閱讀障礙人士通過(guò)電話或PC收聽(tīng)書(shū)寫(xiě)的作品。
● 自動(dòng)轉(zhuǎn)換:實(shí)時(shí)將語(yǔ)音樣本轉(zhuǎn)換成文本
● 汽車(chē)語(yǔ)音識(shí)別:通過(guò)語(yǔ)音控制汽車(chē)的各種功能(雨刮器、收音機(jī)、車(chē)窗等,但不能通過(guò)語(yǔ)音駕駛車(chē)輛?。。?/p>
● 語(yǔ)音生物識(shí)別:說(shuō)話人驗(yàn)證。工作車(chē)間或任何需要某種身份驗(yàn)證的場(chǎng)所可以采用這些應(yīng)用。
● 口述。
● 免提計(jì)算:適用于殘障人士的PC命令語(yǔ)音識(shí)別。
● 家庭自動(dòng)化:通過(guò)語(yǔ)音控制通常需要開(kāi)關(guān)控制的裝置,例如關(guān)閉百葉窗和電燈、打開(kāi)暖氣裝置。
● 醫(yī)療轉(zhuǎn)錄。
現(xiàn)代醫(yī)學(xué)的口述記錄使醫(yī)生不必花費(fèi)大量時(shí)間為財(cái)務(wù)結(jié)算創(chuàng)建文檔,而是把更多的時(shí)間用來(lái)滿足患者的需求。通過(guò)計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù),越來(lái)越多的現(xiàn)代化文檔創(chuàng)建方法得到了應(yīng)用。語(yǔ)音識(shí)別(VR)是這些劃時(shí)代技術(shù)的代表之一。語(yǔ)音識(shí)別的速度是每分鐘200個(gè)字,準(zhǔn)確率高達(dá)99%,使醫(yī)生從傳統(tǒng)的抄寫(xiě)服務(wù)中解放出來(lái)。
目前的寬帶連接可為家庭終端用戶提供下行寬帶。為此DECT論壇(http://www.dect.ch/)推出了全新無(wú)繩電話標(biāo)準(zhǔn)CAT-iq,進(jìn)一步挖掘?qū)拵г赩oIP終端領(lǐng)域的潛力。預(yù)計(jì)將推出下列應(yīng)用:
高清無(wú)繩電話—各大廠商正在積極向市場(chǎng)推出支持高清語(yǔ)音的全新產(chǎn)品。正如上文所述,這意味著升級(jí)話機(jī),使其采用改進(jìn)的麥克風(fēng)和揚(yáng)聲器,充分發(fā)揮寬帶編解碼器的功效。
寬帶電話會(huì)議—采用改進(jìn)的硬件可增加多種新功能,如讓第三方參加語(yǔ)音清晰的電話會(huì)議,為用戶帶來(lái)一種全新的體驗(yàn)。
網(wǎng)絡(luò)收音機(jī)—作為推出的一種全新服務(wù),未來(lái)的CAT-iq產(chǎn)品將支持News-Tickers等產(chǎn)品和更加引人注目的高清網(wǎng)絡(luò)收音機(jī)。這有望成為家用VoIP的殺手級(jí)應(yīng)用,它將互聯(lián)網(wǎng)的強(qiáng)大功能與高清音質(zhì)有機(jī)地結(jié)合起來(lái)?,F(xiàn)在,身在澳大利亞的愛(ài)爾蘭人和身在慕尼黑的中國(guó)人在地下室不用PC就可分別收聽(tīng)Radio Cork和上海FM電臺(tái)節(jié)目。
音頻流媒體—CAT-iq將使無(wú)繩設(shè)備廠商和服務(wù)供應(yīng)商進(jìn)入原來(lái)由高保真專(zhuān)業(yè)廠商占據(jù)的市場(chǎng)。帶有DECT接收器的音頻揚(yáng)聲器將成為家庭內(nèi)部甚至家庭內(nèi)不同樓層之間音頻內(nèi)容傳輸?shù)睦硐虢鉀Q方案。該應(yīng)用設(shè)備不僅具備穩(wěn)定的空中接口,而且具備最佳的功耗。
總結(jié)
處于該產(chǎn)業(yè)鏈上的所有人都會(huì)從高清語(yǔ)音的發(fā)展中受益;最重要的是終端用戶將獲得一種永遠(yuǎn)不想失去的全新體驗(yàn)。