智能手機(jī)及平板電腦的語音辨識應(yīng)用
近年來,智能手機(jī)和筆記本電腦等移動/便攜設(shè)備市場持續(xù)快速發(fā)展。這些產(chǎn)品在不斷集成更多新功能以增強(qiáng)用戶體驗(yàn)的同時,在基本語音通信功能的用戶體驗(yàn)方面仍有充足提升空間,特別是在嘈雜環(huán)境下提升語音清晰度,同時保持語音自然逼真度。例如,用戶在擁擠的商業(yè)街區(qū)行走時,周圍環(huán)境中可能充斥著汽車?yán)?、發(fā)動機(jī)轟鳴、建筑施工噪聲、嘈雜人群噪聲、腳步聲甚至是風(fēng)噪等,此時用手機(jī)進(jìn)行語音通話時,傳統(tǒng)技術(shù)難以提供清晰的語音通信效果。此外,制造商也在為新興的平板電腦等增加視頻通話功能。在利用這些移動/便攜設(shè)備用于電話會議時,周圍環(huán)境中同樣可能包括多種噪聲,如辦公室嘈雜人聲、周圍談話聲、電腦噪聲、筆劃噪聲及玻璃器皿碰擊聲等,要提供清晰的通話效果同樣不易。
在這些應(yīng)用中,要降低或?yàn)V除環(huán)境噪聲,提升語音通信效果,可以采用不同的方法,如專門降噪麥克風(fēng)、模擬電路降噪或數(shù)字電路降噪等(見表1)。這些方法各有其特點(diǎn),相比較而言,采用數(shù)字電路降噪的方法靈活,聲學(xué)設(shè)計復(fù)雜度較低,且降噪效果優(yōu)越。當(dāng)然,便攜設(shè)備設(shè)計人員除了要提供良好的降噪效果,還面臨著多種設(shè)計約束及挑戰(zhàn),如尺寸、能耗、物理聲學(xué)設(shè)計、音頻保真度及成本等。
表1:不同降噪技術(shù)比較。
<center sizset="4" sizcache="5">
先進(jìn)的雙麥克風(fēng)實(shí)時自適應(yīng)噪聲消減技術(shù)
安森美半導(dǎo)體最新推出了基于數(shù)字電路降噪技術(shù)的BelaSigna R261高性能語音捕獲系統(tǒng)級芯片(SoC)。該器件采用先進(jìn)的雙麥克風(fēng)噪聲消減技術(shù),能夠幫助設(shè)計提供優(yōu)異的噪聲消減效果(參見圖1)。這種先進(jìn)的信號處理技術(shù)接受兩個麥克風(fēng)的信號,能夠區(qū)分不同類型的信號,提取有效的語音信息并抑制環(huán)境噪聲,從而提升語音辨識度。
圖1:BelaSigna R261采用先進(jìn)的實(shí)時自適應(yīng)噪聲消減算法。
BelaSigna R261在其集成的ROM存儲器中內(nèi)置了語音提取算法。這種算法利用一個或多個傳感器來提取波形傳播信號,而不需要預(yù)先知道聲源或傳感器位置。這種方案利用全局優(yōu)化準(zhǔn)則,同時工作在頻域、時域和空域,對聲源的數(shù)量及傳感器的數(shù)量沒有限制,與信噪比(SNR)無關(guān),即在低SNR和高SNR環(huán)境下能夠同樣優(yōu)化地工作,非常適合于需要從不同噪聲域中提取有用語音信號的手機(jī)和便攜計算機(jī)等應(yīng)用。
這種自適應(yīng)噪聲抑制算法提供25 dB的噪聲抑制能力,能夠?qū)崟r地分離需要的語音與環(huán)境噪聲,適合于各種語音源和各種位置下的語音,同時能夠保證音質(zhì)自然(其它方案處理后聲音不自然、不飽滿),可以有效配合各種品質(zhì)的麥克風(fēng)工作。
BelaSigna R261關(guān)鍵特性解析
BelaSigna R261是一款高性能的語音捕獲SoC,集成了數(shù)字信號處理器(DSP)、穩(wěn)壓器、鎖相環(huán)(PLL)、電平轉(zhuǎn)換器及ROM存儲器,如此高的集成度與其它方案相比,能夠降低物料單(BOM)。如圖2所示,這器件支持雙麥克風(fēng)直接輸入,噪聲消減算法內(nèi)置于集成的ROM存儲器中,基于DSP結(jié)構(gòu)的應(yīng)用控制器提供高性能及超低能耗,提供雙通模擬輸出,并支持?jǐn)?shù)字麥克風(fēng)輸出。此外,內(nèi)置的電源管理模塊支持1.8 V至3.3 V的供電電壓,內(nèi)置的片上PLL提供多種頻率選擇,還提供I2C接口。
圖2:BelaSigna R261 高性能語音捕獲SoC功能架構(gòu)圖。
[!--empirenews.page--]
特別值得一提的是,BelaSigna R261采用的雙麥克風(fēng)實(shí)時自適應(yīng)噪聲消減算法提供兩種基本的算法模式,分別是遠(yuǎn)距離拾音模式(算法模式0)和近距離拾音模式(算法模式1)。算法模式0針對遠(yuǎn)距離拾音而優(yōu)化,可以拾取多達(dá)6米遠(yuǎn)的語音,同時抑制噪聲,并支持360度全方位拾音,適合于筆記本電腦、免提電話/會議或手機(jī)免提通話模式。在這種模式下,即使用戶沒有對準(zhǔn)麥克風(fēng),甚至是遠(yuǎn)離麥克風(fēng),都能提供極佳的語音清晰度,從而增強(qiáng)用戶使用的自由度。算法模式1針對近距離拾音而優(yōu)化,這時用戶離麥克風(fēng)極近(距離小于5厘米),即在近距離內(nèi)拾取語音,有效抑制各種環(huán)境噪聲,適用于手機(jī)、學(xué)習(xí)機(jī)、對講機(jī)等在強(qiáng)噪聲環(huán)境中工作的設(shè)備。
除了這兩種基本算法模式,BelaSigna R261還提供定制算法模式,幫助制造商滿足特定應(yīng)用需求。這種算法模式支持特殊配置,并能夠通過外部EEPROM或I2C控制接口加載新的算法參數(shù)來調(diào)整。算法效果能夠根據(jù)特定應(yīng)用、麥克風(fēng)類型、位置及其它系統(tǒng)參數(shù)來優(yōu)化。
表2:BelaSigna R261支持遠(yuǎn)距離拾音、近距離拾音及定制等不同模式。
如上所述,BelaSigna R261提供高集成度,內(nèi)置自適應(yīng)噪聲消減算法,能夠直接連接至數(shù)字麥克風(fēng)接口或主芯片(基帶處理器)的麥克風(fēng)輸入端。故除了支持多種拾音模式,這器件的另一項(xiàng)重要優(yōu)勢就是便于集成到設(shè)計之中,可將設(shè)計入選(design-in)所須的時間和工程工作減至最少,因?yàn)樵O(shè)計團(tuán)隊(duì)不須開發(fā)或獲取算法,也不須設(shè)計復(fù)雜的支援及接口電路。
這器件也使關(guān)注成本的原設(shè)備制造商(OEM)能夠在設(shè)計中采用便宜的兩個(不一定匹配的)全向麥克風(fēng),令麥克風(fēng)的布設(shè)更靈活,且生產(chǎn)線上不須調(diào)試麥克風(fēng),進(jìn)一步節(jié)省時間及成本。這SoC采用極緊湊的5.3 mm2 WLCSP封裝(包括26球和30球兩種版本),占用的電路板空間比其它可選方案小得多,即使空間最受限的便攜消費(fèi)電子產(chǎn)品外形因數(shù)也用得上。此外,這器件在3.3 V電壓時的電流消耗為15 mA,能耗極低。
BelaSigna R261應(yīng)用設(shè)計要點(diǎn)
由于BelaSigna R261基于ROM的噪聲消減算法非常靈活,麥克風(fēng)布局(物理聲學(xué)設(shè)計)就存在多種可能的選擇,但默認(rèn)算法只有麥克風(fēng)以下述方式布局時才能最優(yōu)工作:1)兩個麥克風(fēng)面向用戶的嘴;2)兩個麥克風(fēng)的中間點(diǎn)位于距離各個麥克風(fēng)10至25 mm范圍內(nèi)。當(dāng)然,使用定制模式時也能使用其它麥克風(fēng)布局配置。
在電路設(shè)計方面,BelaSigna R261的設(shè)計針對的是在單個系統(tǒng)中同時支持?jǐn)?shù)字及模擬處理。由于這種混合信號電路屬性,要維持高音頻保真度,審慎設(shè)計印制電路板(PCB)布線就至關(guān)重要。為了避免耦合噪聲進(jìn)入音頻信號路徑,要使數(shù)字信號走線(trace)遠(yuǎn)離模擬信號走線。為了避免電氣反饋耦合,還需要將輸入走線與輸出走線隔離。
在接地設(shè)計方面,接地層應(yīng)該分為兩部分,分別是模擬接地層(VSSA)和數(shù)字接地層(VSSD)。這兩個接地層應(yīng)當(dāng)通過單個點(diǎn)(即星形連接點(diǎn))連接在一起。星形連接點(diǎn)應(yīng)當(dāng)位于電源穩(wěn)壓器輸出端電容的接地端。當(dāng)然,這些只是設(shè)計人員在應(yīng)用BelaSigna R261設(shè)計時需要注意的部分問題。詳細(xì)的設(shè)計要點(diǎn)參見參考資料2。
總結(jié):
便攜設(shè)備音頻系統(tǒng)設(shè)計人員需要易于集成到其系統(tǒng)中的高性能語音捕獲方案,同時滿足其對尺寸、能耗及成本等方面的要求。安森美半導(dǎo)體身為應(yīng)用于高能效電子產(chǎn)品的首要高性能硅方案供應(yīng)商,以BelaSigna R261高性能語音捕獲SoC為設(shè)計人員提供簡便的選擇。這器件具備高集成度,內(nèi)置先進(jìn)的自適應(yīng)噪聲消減算法,支持多種語音拾取模式,使智能手機(jī)、對講機(jī)、筆記本及平板電腦等應(yīng)用都能夠提供清晰舒適的語音通信,具有極高的設(shè)計靈活度,同時尺寸小、功耗低,便于選用低成本的麥克風(fēng),使各類便攜消費(fèi)電子產(chǎn)品制造商都能大幅提升語音辨識度及客戶滿意度,并加快產(chǎn)品上市進(jìn)程。