智能語音產(chǎn)業(yè)需要什么技術(shù)的推動
AIoT是指人工智能技術(shù)(AI)與物聯(lián)網(wǎng)(IoT)在實際應(yīng)用中的落地融合,AIoT 既是技術(shù)應(yīng)用,又是產(chǎn)業(yè)布局,AIoT是必然的發(fā)展趨勢。AIoT技術(shù)建構(gòu)一種更高級形式的智能化生態(tài)體系,即通過人工智能的方式實現(xiàn)萬物互融。
目前中國AIoT行業(yè)研究與運用正處于高速進步期,國務(wù)院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》提出,到2020年人工智能總體技術(shù)和應(yīng)用與世界先進水平同步,核心產(chǎn)業(yè)規(guī)模超過1500億元,到2025年人工智能核心產(chǎn)業(yè)規(guī)模超過4000億元,到2030年人工智能核心產(chǎn)業(yè)規(guī)模超過1萬億元。隨著科技、制造等業(yè)界巨頭公司布局深入,以及眾多垂直領(lǐng)域的創(chuàng)業(yè)公司不斷誕生和成長,人工智能產(chǎn)業(yè)級和消費級應(yīng)用精品將相繼誕生,滿足市場的需求。百度、騰訊、亞馬遜、阿里、喜馬拉雅、小米、美的、海爾等眾多行業(yè)巨頭都開始布局相關(guān)應(yīng)用。
在AIoT領(lǐng)域,一項重要的核心技術(shù)就是智能語音,對IoT設(shè)備影響最大的產(chǎn)品是智能語音,智能語音助手將對IoT設(shè)備帶來巨大的技術(shù)革命。實際上,智能語音,早已不是什么新鮮的事情,國外有如:蘋果Siri,微軟小娜,Google Assistant,亞馬遜的Alexa這樣的智能語音大咖。國內(nèi)有靈犀助手(科大訊飛),小度(百度),小愛同學(xué)(小米)這樣的后來跟進者。智能語音的一項關(guān)鍵就是語音交互,而要做到語音交互,聲音的前后端處理缺一不可。
說到聲音處理技術(shù),首先就會想到珠海炬芯科技,炬芯科技深耕聲音領(lǐng)域二十余年,被稱為國內(nèi)聲音前處理專家,在聲音前處理技術(shù)方面有著非常獨家的優(yōu)勢,在低功耗和聲音前處理技術(shù)上深有造詣。在拾音技術(shù)上已經(jīng)采用雙麥克風(fēng)整列,在離線和在線語音的處理方面也非常領(lǐng)先,同時也依賴于炬芯科技在行業(yè)二十余年的經(jīng)驗和技術(shù)的積累。
炬芯科技在過去三十多年,一直在進行聲音的處理工作,例如 MP3 (聲音的后處理技術(shù))、錄音筆等聲音的保留、存儲(聲音的前處理),聲音的麥克風(fēng)識別,聲音的回聲消除及降噪(聲音的前處理)、后期的音效增強(聲音的后處理技術(shù))等等。
根據(jù)炬芯技術(shù)市場專家陶永耀先生的解釋,聲音的前處理技術(shù),是聲音沒有進入傳輸、沒有存儲之前的處理。聲音前處理目的,就是讓聲音的存儲、傳輸效率更高,識別率更好。(例如回聲消除、降噪、聲音活動檢測等等。)聲音前處理技術(shù)其實是解決機器“聽到”和“聽清”兩件事,從而達到“聽懂”的目的。聲音的“聽到”主要依托的是麥克風(fēng)。主要形式為單個麥克風(fēng)或麥克風(fēng)陣列(多個麥克風(fēng)按照一定規(guī)則排列,在特定空間對聲音進行獲取和處理)。而基于麥克風(fēng)的語音信號處理算法則是讓聲音“聽懂”的關(guān)鍵。麥克風(fēng)+算法,在不同的環(huán)境下排列組合,最終達到“聽到”和“聽懂”。
聲音的后處理技術(shù),是聲音經(jīng)過存儲之后進行播放的同時處理。是對音源例如 MP3 等媒體解碼播放的聲音進音效增強處理(例如虛擬重低音、環(huán)繞立體聲、高音增強、EQ 等等)。聲音的前處理技術(shù),是聲音沒有進入傳輸、沒有存儲之前的處理。聲音前處理目的,就是讓聲音的存儲、傳輸效率更高,識別率更好(例如回聲消除、降噪、聲音活動檢測等等)。
在智能語音領(lǐng)域,炬芯已經(jīng)掌握了聲音前處理、聲音后處理的關(guān)鍵技術(shù),這些技術(shù)對于智能語音的發(fā)展無疑是非常重大的,而智能語音又是AIoT產(chǎn)業(yè)最關(guān)鍵的技術(shù)應(yīng)用。炬芯的這些語音交互技術(shù),可以推動智能語音的市場發(fā)展,從而讓更多的AIoT設(shè)備落地。