降噪語音捕獲SoC提升語音辨識度的數(shù)字電路

時間：2012-06-19 10:02:40

關鍵字：數(shù)字電路語音辨識降噪 SoC

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]近年來，智能手機和筆記本電腦等移動/便攜設備市場持續(xù)快速發(fā)展。這些產品在不斷集成更多新功能以增強用戶體驗的同時，在基本語音通信功能的用戶體驗方面仍有充足提升空間，特別是在嘈雜環(huán)境下提升語音清晰度，同時保

近年來，智能手機和筆記本電腦等移動/便攜設備市場持續(xù)快速發(fā)展。這些產品在不斷集成更多新功能以增強用戶體驗的同時，在基本語音通信功能的用戶體驗方面仍有充足提升空間，特別是在嘈雜環(huán)境下提升語音清晰度，同時保持語音自然逼真度。例如，用戶在擁擠的商業(yè)街區(qū)行走時，周圍環(huán)境中可能充斥著汽車喇叭、發(fā)動機轟鳴、建筑施工噪聲、嘈雜人群噪聲、腳步聲甚至是風噪等，此時用手機進行語音通話時，傳統(tǒng)技術難以提供清晰的語音通信效果。此外，制造商也在為新興的平板電腦等增加視頻通話功能。在利用這些移動/便攜設備用于電話會議時，周圍環(huán)境中同樣可能包括多種噪聲，如辦公室嘈雜人聲、周圍談話聲、電腦噪聲、筆劃噪聲及玻璃器皿碰擊聲等，要提供清晰的通話效果同樣不易。

　　在這些應用中，要降低或濾除環(huán)境噪聲，提升語音通信效果，可以采用不同的方法，如專門降噪麥克風、模擬電路降噪或數(shù)字電路降噪等。這些方法各有其特點，相比較而言，采用數(shù)字電路降噪的方法靈活，聲學設計復雜度較低，且降噪效果優(yōu)越。當然，便攜設備設計人員除了要提供良好的降噪效果，還面臨著多種設計約束及挑戰(zhàn)，如尺寸、能耗、物理聲學設計、音頻保真度及成本等。

　　先進的雙麥克風實時自適應噪聲消減技術

　　安森美半導體最新推出了基于數(shù)字電路降噪技術的BelaSigna R261高性能語音捕獲系統(tǒng)級芯片(SoC)。該器件采用先進的雙麥克風噪聲消減技術，能夠幫助設計提供優(yōu)異的噪聲消減效果(參見圖1)。這種先進的信號處理技術接受兩個麥克風的信號，能夠區(qū)分不同類型的信號，提取有效的語音信息并抑制環(huán)境噪聲，從而提升語音辨識度。

　　圖1：BelaSigna R261采用先進的實時自適應噪聲消減算法。

　　BelaSigna R261在其集成的ROM存儲器中內置了語音提取算法。這種算法利用一個或多個傳感器來提取波形傳播信號，而不需要預先知道聲源或傳感器位置。這種方案利用全局優(yōu)化準則，同時工作在頻域、時域和空域，對聲源的數(shù)量及傳感器的數(shù)量沒有限制，與信噪比(SNR)無關，即在低SNR和高SNR環(huán)境下能夠同樣優(yōu)化地工作，非常適合于需要從不同噪聲域中提取有用語音信號的手機和便攜計算機等應用。

　　這種自適應噪聲抑制算法提供25 dB的噪聲抑制能力，能夠實時地分離需要的語音與環(huán)境噪聲，適合于各種語音源和各種位置下的語音，同時能夠保證音質自然(其它方案處理后聲音不自然、不飽滿)，可以有效配合各種品質的麥克風工作。

　　BelaSigna R261關鍵特性解析

　　BelaSigna R261是一款高性能的語音捕獲SoC，集成了數(shù)字信號處理器(DSP)、穩(wěn)壓器、鎖相環(huán)(PLL)、電平轉換器及ROM存儲器，如此高的集成度與其它方案相比，能夠降低物料單(BOM)。如圖2所示，這器件支持雙麥克風直接輸入，噪聲消減算法內置于集成的ROM存儲器中，基于DSP結構的應用控制器提供高性能及超低能耗，提供雙通模擬輸出，并支持數(shù)字麥克風輸出。此外，內置的電源管理模塊支持1.8 V至3.3 V的供電電壓，內置的片上PLL提供多種頻率選擇，還提供I2C接口。

　　圖2：BelaSigna R261 高性能語音捕獲SoC功能架構圖。 [!--empirenews.page--]
特別值得一提的是，BelaSigna R261采用的雙麥克風實時自適應噪聲消減算法提供兩種基本的算法模式，分別是遠距離拾音模式(算法模式0)和近距離拾音模式(算法模式1)。算法模式0針對遠距離拾音而優(yōu)化，可以拾取多達6米遠的語音，同時抑制噪聲，并支持360度全方位拾音，適合于筆記本電腦、免提電話/會議或手機免提通話模式。在這種模式下，即使用戶沒有對準麥克風，甚至是遠離麥克風，都能提供極佳的語音清晰度，從而增強用戶使用的自由度。算法模式1針對近距離拾音而優(yōu)化，這時用戶離麥克風極近(距離小于5厘米)，即在近距離內拾取語音，有效抑制各種環(huán)境噪聲，適用于手機、學習機、對講機等在強噪聲環(huán)境中工作的設備。

　　除了這兩種基本算法模式，BelaSigna R261還提供定制算法模式，幫助制造商滿足特定應用需求。這種算法模式支持特殊配置，并能夠通過外部EEPROM或I2C控制接口加載新的算法參數(shù)來調整。算法效果能夠根據(jù)特定應用、麥克風類型、位置及其它系統(tǒng)參數(shù)來優(yōu)化。

　　表2：BelaSigna R261支持遠距離拾音、近距離拾音及定制等不同模式。

　　如上所述，BelaSigna R261提供高集成度，內置自適應噪聲消減算法，能夠直接連接至數(shù)字麥克風接口或主芯片(基帶處理器)的麥克風輸入端。故除了支持多種拾音模式，這器件的另一項重要優(yōu)勢就是便于集成到設計之中，可將設計入選(design-in)所須的時間和工程工作減至最少，因為設計團隊不須開發(fā)或獲取算法，也不須設計復雜的支援及接口電路。

　　這器件也使關注成本的原設備制造商(OEM)能夠在設計中采用便宜的兩個(不一定匹配的)全向麥克風，令麥克風的布設更靈活，且生產線上不須調試麥克風，進一步節(jié)省時間及成本。這SoC采用極緊湊的5.3 mm2 WLCSP封裝(包括26球和30球兩種版本)，占用的電路板空間比其它可選方案小得多，即使空間最受限的便攜消費電子產品外形因數(shù)也用得上。此外，這器件在3.3 V電壓時的電流消耗為15 mA，能耗極低。

　　BelaSigna R261應用設計要點

　　由于BelaSigna R261基于ROM的噪聲消減算法非常靈活，麥克風布局(物理聲學設計)就存在多種可能的選擇，但默認算法只有麥克風以下述方式布局時才能最優(yōu)工作：1)兩個麥克風面向用戶的嘴;2)兩個麥克風的中間點位于距離各個麥克風10至25 mm范圍內。當然，使用定制模式時也能使用其它麥克風布局配置。

　　在電路設計方面，BelaSigna R261的設計針對的是在單個系統(tǒng)中同時支持數(shù)字及模擬處理。由于這種混合信號電路屬性，要維持高音頻保真度，審慎設計印制電路板(PCB)布線就至關重要。為了避免耦合噪聲進入音頻信號路徑，要使數(shù)字信號走線(trace)遠離模擬信號走線。為了避免電氣反饋耦合，還需要將輸入走線與輸出走線隔離。

　　在接地設計方面，接地層應該分為兩部分，分別是模擬接地層(VSSA)和數(shù)字接地層(VSSD)。這兩個接地層應當通過單個點(即星形連接點)連接在一起。星形連接點應當位于電源穩(wěn)壓器輸出端電容的接地端。當然，這些只是設計人員在應用BelaSigna R261設計時需要注意的部分問題。詳細的設計要點參見參考資料2。

　　總結：

　　便攜設備音頻系統(tǒng)設計人員需要易于集成到其系統(tǒng)中的高性能語音捕獲方案，同時滿足其對尺寸、能耗及成本等方面的要求。安森美半導體身為應用于高能效電子產品的首要高性能硅方案供應商，以BelaSigna R261高性能語音捕獲SoC為設計人員提供簡便的選擇。這器件具備高集成度，內置先進的自適應噪聲消減算法，支持多種語音拾取模式，使智能手機、對講機、筆記本及平板電腦等應用都能夠提供清晰舒適的語音通信，具有極高的設計靈活度，同時尺寸小、功耗低，便于選用低成本的麥克風，使各類便攜消費電子產品制造商都能大幅提升語音辨識度及客戶滿意度，并加快產品上市進程。