摘要:本文將主要闡述在電視中應用陣列式麥克風,可以大大提升用戶的體驗感受;而且提出了一些解決回聲的技術(shù)方案。
關(guān)鍵詞:聊天電視;陣列式麥克風;回聲;體驗感;校準
前言
隨著國家三網(wǎng)融合政策地推進并落實,電視機作為家庭的娛樂終端,也將帶來一些非常積極的變化。例如,像深圳創(chuàng)維在2010年2月就率先研發(fā)成功了“聊天電視”,隨后海信、TCL等家電廠家也推出相似的產(chǎn)品。
在聊天電視中,麥克風的語音收集就變得非常重要。目前多數(shù)聊天電視基本上都是使用了單個麥克風進行收音,可能是有線麥克風,也可能是無線麥克風。采用單個麥克風收音,會帶來以下一些問題。
● 用戶體驗不好。
即用戶在視頻聊天的過程中,需要手握著,或者盡量靠近麥克風來說話,感覺不好;特別是很多家庭成員要一起聊天時,更顯得擁擠不堪。
使用有線麥克風,連接線顯得很啰嗦,而且影響家庭的裝飾;無線麥克風在人移動速度稍快時,都容易出現(xiàn)斷音;而且無論采取哪種方式,用了一段時間后,都需要更換電池或者再次充電。
● 成本較高。
目前在聊天電視上,采用無線麥克風,載波調(diào)制為2.4GHz的方式,已經(jīng)成為主流,但是這種方式的成本明顯偏高。
針對上述兩個問題,我們提出使用陣列式麥克風應用在電視上,可以較好解決這兩個問題。
陣列式麥克風
陣列式麥克風(Array Microphone),又名麥克風陣列(Microphone Array),即設置兩組以上麥克風,并以這些麥克風對音訊進行偵測,所得到的資料交由數(shù)字信號處理器(DSP)進行比對,用以還原聲音的原貌,并消除背景雜音。陣列式麥克風目前是HD Audio的標準之一。Windows Vista已可以支持陣列式麥克風。[!--empirenews.page--]
陣列式麥克風通過對拾取的多路語音信號進行分析與處理,使陣列形成的波束方向圖主瓣對準目標語音,“零點”指向干擾源以抑制干擾信號,從而盡可能地獲取目標語音。其中波束方向及波束主瓣寬度與麥克風的間距、麥克風數(shù)目、麥克風的擺放位置、聲源入射角及采樣頻率緊密相關(guān)。波束的形成不僅消除了使用單個麥克風時需人工調(diào)節(jié)麥克風指向性問題,而且可以使輸出語音的信噪比大幅度提高,從而無需人工干預亦可獲得高質(zhì)量的語音。
使用傳統(tǒng)麥克風說話時,人需要盡量靠近麥克風,對于系統(tǒng)來說,靠近麥克風說話的就是“主音”,系統(tǒng)獲得較大的輸入。而對于旁邊的雜音,或者對話者從揚聲器輸出的聲音相對“主音”來說,幅度都是比較小的,都屬于“干擾音”。這樣系統(tǒng)可以更準確過濾掉“干擾音”,保留“主音”。在這種傳統(tǒng)的麥克風拾音過程中,回聲的問題并不突出。而在應用陣列式麥克風時,回聲問題則需要重點關(guān)注。
回聲是指在揚聲器播出的聲音在被受話方聽到的同時,語音信號也通過多種途徑被麥克風拾取,重新回輸至原說話人處?;芈曂ㄟ^的路徑各不相同,也就產(chǎn)生了不同的延時回聲,包括直接回聲和間接回聲。直接回聲是指揚聲器播出的聲音未經(jīng)任何的反射直接進入麥克風,這種回聲的延時最短,它同遠端說話者的語音能量,揚聲器和麥克風間的距離、角度、揚聲器的播放音量,麥克風的拾音靈敏度直接相關(guān)。而間接回聲是指揚聲器播出的聲音經(jīng)過不同的路徑(如房屋或房屋內(nèi)任何的物品)一次或多次反射后進入麥克風后所產(chǎn)生回聲的集合。房屋內(nèi)任何物品的移動或改變都會改變回聲通道。因此這種回聲的特點是多路徑和時變的。
在陣列式麥克風應用中,由于人在說話時,不再需要緊貼麥克風,相對而言,人的“主音”對麥克風的影響力可能會降低,即旁邊的“干擾音”有可能會干擾“主音”,導致系統(tǒng)無法正確識別哪個才是真正的“主音”。特別是在聊天過程中,對方的聲音從揚聲器出來,如果聲音比較大,會被麥克風重新獲取,被對方再一次或者多次聽到他本人說過的話。這就是在應用陣列式麥克風所要面對的最大的難題。
簡而言之,在應用陣列式麥克風過程中,建議關(guān)注以下幾個問題:收音范圍是否足夠?qū)?收音距離是否足夠遠;收音的效果是否足夠清晰;回聲的問題是否得以較好的消除。其中收音范圍可以通過更換麥克風的個數(shù)以及麥克風的擺放位置來調(diào)整;而收音的距離和清晰度等可以通過調(diào)整麥克風的靈敏度來配合,本文不作過多的論述。由于對于回聲的問題最難處理,本文也試圖提出一些個人的想法。
[!--empirenews.page--]
陣列式麥克風在電視上的應用
目前,陣列式麥克風的技術(shù)發(fā)展已經(jīng)較為成熟,在人的語音收音距離要求不是很遠,而且空間不大,收音范圍較窄的情況下,陣列式麥克風已經(jīng)被大量應用,如筆記本電腦、車載藍牙設備等等。同樣,陣列式麥克風也可以應用在電視機上,使得用戶可以無拘無束地與遠方的家人、朋友等進行聊天交流(圖1)。
當陣列式麥克風在電視機上應用時,需要更加遠的收音距離,需要更加寬的收音范圍,而這些問題都可以比較容易解決,但是回聲的問題則變得更為突出。因為電視機是家庭的娛樂中心,所以電視機的揚聲器音量輸出也許會比較大,而麥克風大部分都是設計在電視機上,遠端說話的聲音從揚聲器出來,很容易被麥克風重新拾取,再傳送到原說話者的那邊,嚴重一些的情況,還可能形成自激。
在電視聊天過程中,如果存在回聲,會導致說話的人感覺不舒服;而且語音疊加,導致語音不清晰,所以要盡量消除回聲。電視機的使用場合、環(huán)境各不相同,比如說揚聲器的音量大小差異很大,空間的布置差異也很大等,這些都是與回聲直接相關(guān)的因素,而且這些因素都為不可控,不可預估的因素。為了解決在電視機上應用陣列式麥克風,可能會產(chǎn)生的回聲問題,需要在系統(tǒng)內(nèi)部設計自適應濾波器。自適應濾波器的基本思想是估計回音路徑的特征參數(shù),產(chǎn)生一個模擬的回音路徑,得出模擬的回音信號。然后接收信號中減去這個自適應濾波器模擬出來的回音信號,實現(xiàn)回音抵消。
自適應濾波器的架構(gòu)如圖2。圖中所示的濾波器的輸入是x(n)={x(n),x(x-1),⋯x(n-N+1)}T,濾波器的權(quán)系數(shù)是h(n)={h1(n),h2(n),⋯hN (n)}T,d(n)為期望輸出信號,d^(n)為濾波器的實際輸出,也稱估計值。e(n)為誤差,e(n)=d(n)-d^(n)。由誤差經(jīng)過自適應算法,來調(diào)整濾波系數(shù),使得濾波實際輸出接近期望輸出的信號。
在實際的電視中的應用原理框圖見圖3。圖中f(n)代表來自遠方的語音信號;r1(n)為f(n)從揚聲器出來,經(jīng)過不同的回聲通道所產(chǎn)生的回聲集合,并被陣列式麥克風收音;s(n)為本地用戶說話的語音信號;r(n)為自適應濾波器對f(n)進行了預處理,估算f(n)信號所產(chǎn)生的回音,其動態(tài)估算值為r(n)。那么通過計算,本地用戶所傳送出去的聲音信號應該為u(n)=y(n)-r(n)=s(n)+r1(n)-r(n)。在理想的狀態(tài)下,如果自適應濾波器所產(chǎn)生的回聲估算值r(n)等于實際的回聲集合r1(n),即r1(n)-r(n)=0,那么回聲將被剛好完全消除。
由于用戶的使用環(huán)境差異非常大,單獨靠自適應濾波器內(nèi)部的算法,動態(tài)修改濾波器的權(quán)系數(shù),很難使得輸出的r(n)=r1(n)。所以如果自適應濾波器在DSP內(nèi)部動態(tài)修正權(quán)系數(shù)的同時,把電視機使用的環(huán)境因素考慮進去,充分分析回聲的通道的各種情況,結(jié)合“內(nèi)外”的因素,來動態(tài)修正濾波器的權(quán)系數(shù),這樣將會使得r(n)更加接近于實際的r1(n),從而更地的消除回聲。帶有內(nèi)部校準信號的系統(tǒng)框圖如圖4。
其中最主要是增加了一個內(nèi)部校準單元,內(nèi)部存儲有一些特定的音頻測試信號Fn。人聲所包括的頻率主要從300~3400Hz之間,所以內(nèi)部的測試信號Fn從這個頻率區(qū)間進行取樣即可,如Fn=300Hz、400Hz、500Hz等等,以此類推。其邏輯思路見圖5。
舉例說明:當用戶發(fā)現(xiàn)在聊天過程中回聲較大,可以人為通過遙控器的按鍵或者鍵控板上的按鍵等方式來發(fā)出校準指令。此時,內(nèi)部校準單元會逐一發(fā)出相關(guān)的測試信號Fn,測試信號通過主信道,通過功放,從揚聲器發(fā)出聲音,聲音再通過不同的回聲通道,被陣列式麥克風拾取,回送到內(nèi)部校準單元。由于測試信號為固有的信號,內(nèi)部校準單元可以準確對比測試信號和回聲之間的差異,考慮與環(huán)境相關(guān)的回聲因素,產(chǎn)生新校正因子γ。
校正因子γ送到自適應濾波器,讓自適應濾波器修正濾波器的權(quán)系數(shù),這個權(quán)系數(shù)可以說在一定程度上考慮了外部的環(huán)境對回聲的影響因素,所以自適應濾波器所產(chǎn)生的r(n)將更加接近r1(n),從而可以更好的消除回聲。
小結(jié)
可以預見,聊天功能將會成為未來電視機的主要功能之一,而在電視機中應用陣列式麥克風,可以擺脫對傳統(tǒng)形式麥克風的依賴,給用戶帶來較好的體驗感受;而加強對回聲的消除處理,是陣列式麥克風得以在電視機上廣泛應用的保證。