聲音前處理技術(shù)將推動智能語音產(chǎn)業(yè)的發(fā)展
(文章來源:吾知科技)
在AIoT領(lǐng)域,一項重要的核心技術(shù)就是智能語音,對IoT設(shè)備影響最大的產(chǎn)品是智能語音,智能語音助手將對IoT設(shè)備帶來巨大的技術(shù)革命。實際上,智能語音,早已不是什么新鮮的事情,國外有如:蘋果Siri,微軟小娜,Google Assistant,亞馬遜的Alexa這樣的智能語音大咖。國內(nèi)有靈犀助手(科大訊飛),小度(百度),小愛同學(xué)(小米)這樣的后來跟進者。智能語音的一項關(guān)鍵就是語音交互,而要做到語音交互,聲音的前后端處理缺一不可。
說到聲音處理技術(shù),首先就會想到珠海炬芯科技,炬芯科技深耕聲音領(lǐng)域二十余年,被稱為國內(nèi)聲音前處理專家,在聲音前處理技術(shù)方面有著非常獨家的優(yōu)勢,在低功耗和聲音前處理技術(shù)上深有造詣。在拾音技術(shù)上已經(jīng)采用雙麥克風(fēng)整列,在離線和在線語音的處理方面也非常領(lǐng)先,同時也依賴于炬芯科技在行業(yè)二十余年的經(jīng)驗和技術(shù)的積累。
炬芯科技在過去三十多年,一直在進行聲音的處理工作,例如 MP3 (聲音的后處理技術(shù))、錄音筆等聲音的保留、存儲(聲音的前處理),聲音的麥克風(fēng)識別,聲音的回聲消除及降噪(聲音的前處理)、后期的音效增強(聲音的后處理技術(shù))等等。
根據(jù)炬芯技術(shù)市場專家陶永耀先生的解釋,聲音的前處理技術(shù),是聲音沒有進入傳輸、沒有存儲之前的處理。聲音前處理目的,就是讓聲音的存儲、傳輸效率更高,識別率更好。(例如回聲消除、降噪、聲音活動檢測等等。)聲音前處理技術(shù)其實是解決機器“聽到”和“聽清”兩件事,從而達到“聽懂”的目的。聲音的“聽到”主要依托的是麥克風(fēng)。主要形式為單個麥克風(fēng)或麥克風(fēng)陣列(多個麥克風(fēng)按照一定規(guī)則排列,在特定空間對聲音進行獲取和處理)。而基于麥克風(fēng)的語音信號處理算法則是讓聲音“聽懂”的關(guān)鍵。麥克風(fēng)+算法,在不同的環(huán)境下排列組合,最終達到“聽到”和“聽懂”。
聲音的后處理技術(shù),是聲音經(jīng)過存儲之后進行播放的同時處理。是對音源例如 MP3 等媒體解碼播放的聲音進音效增強處理(例如虛擬重低音、環(huán)繞立體聲、高音增強、EQ 等等)。聲音的前處理技術(shù),是聲音沒有進入傳輸、沒有存儲之前的處理。聲音前處理目的,就是讓聲音的存儲、傳輸效率更高,識別率更好(例如回聲消除、降噪、聲音活動檢測等等)。
在智能語音領(lǐng)域,炬芯已經(jīng)掌握了聲音前處理、聲音后處理的關(guān)鍵技術(shù),這些技術(shù)對于智能語音的發(fā)展無疑是非常重大的,而智能語音又是AIoT產(chǎn)業(yè)最關(guān)鍵的技術(shù)應(yīng)用。炬芯的這些語音交互技術(shù),可以推動智能語音的市場發(fā)展,從而讓更多的AIoT設(shè)備落地。
? ? ? ?