智能語(yǔ)音產(chǎn)業(yè)需要什么技術(shù)的推動(dòng)
AIoT是指人工智能技術(shù)(AI)與物聯(lián)網(wǎng)(IoT)在實(shí)際應(yīng)用中的落地融合,AIoT 既是技術(shù)應(yīng)用,又是產(chǎn)業(yè)布局,AIoT是必然的發(fā)展趨勢(shì)。AIoT技術(shù)建構(gòu)一種更高級(jí)形式的智能化生態(tài)體系,即通過(guò)人工智能的方式實(shí)現(xiàn)萬(wàn)物互融。
目前中國(guó)AIoT行業(yè)研究與運(yùn)用正處于高速進(jìn)步期,國(guó)務(wù)院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》提出,到2020年人工智能總體技術(shù)和應(yīng)用與世界先進(jìn)水平同步,核心產(chǎn)業(yè)規(guī)模超過(guò)1500億元,到2025年人工智能核心產(chǎn)業(yè)規(guī)模超過(guò)4000億元,到2030年人工智能核心產(chǎn)業(yè)規(guī)模超過(guò)1萬(wàn)億元。隨著科技、制造等業(yè)界巨頭公司布局深入,以及眾多垂直領(lǐng)域的創(chuàng)業(yè)公司不斷誕生和成長(zhǎng),人工智能產(chǎn)業(yè)級(jí)和消費(fèi)級(jí)應(yīng)用精品將相繼誕生,滿足市場(chǎng)的需求。百度、騰訊、亞馬遜、阿里、喜馬拉雅、小米、美的、海爾等眾多行業(yè)巨頭都開(kāi)始布局相關(guān)應(yīng)用。
在AIoT領(lǐng)域,一項(xiàng)重要的核心技術(shù)就是智能語(yǔ)音,對(duì)IoT設(shè)備影響最大的產(chǎn)品是智能語(yǔ)音,智能語(yǔ)音助手將對(duì)IoT設(shè)備帶來(lái)巨大的技術(shù)革命。實(shí)際上,智能語(yǔ)音,早已不是什么新鮮的事情,國(guó)外有如:蘋(píng)果Siri,微軟小娜,Google Assistant,亞馬遜的Alexa這樣的智能語(yǔ)音大咖。國(guó)內(nèi)有靈犀助手(科大訊飛),小度(百度),小愛(ài)同學(xué)(小米)這樣的后來(lái)跟進(jìn)者。智能語(yǔ)音的一項(xiàng)關(guān)鍵就是語(yǔ)音交互,而要做到語(yǔ)音交互,聲音的前后端處理缺一不可。
說(shuō)到聲音處理技術(shù),首先就會(huì)想到珠海炬芯科技,炬芯科技深耕聲音領(lǐng)域二十余年,被稱為國(guó)內(nèi)聲音前處理專家,在聲音前處理技術(shù)方面有著非常獨(dú)家的優(yōu)勢(shì),在低功耗和聲音前處理技術(shù)上深有造詣。在拾音技術(shù)上已經(jīng)采用雙麥克風(fēng)整列,在離線和在線語(yǔ)音的處理方面也非常領(lǐng)先,同時(shí)也依賴于炬芯科技在行業(yè)二十余年的經(jīng)驗(yàn)和技術(shù)的積累。
炬芯科技在過(guò)去三十多年,一直在進(jìn)行聲音的處理工作,例如 MP3 (聲音的后處理技術(shù))、錄音筆等聲音的保留、存儲(chǔ)(聲音的前處理),聲音的麥克風(fēng)識(shí)別,聲音的回聲消除及降噪(聲音的前處理)、后期的音效增強(qiáng)(聲音的后處理技術(shù))等等。
根據(jù)炬芯技術(shù)市場(chǎng)專家陶永耀先生的解釋,聲音的前處理技術(shù),是聲音沒(méi)有進(jìn)入傳輸、沒(méi)有存儲(chǔ)之前的處理。聲音前處理目的,就是讓聲音的存儲(chǔ)、傳輸效率更高,識(shí)別率更好。(例如回聲消除、降噪、聲音活動(dòng)檢測(cè)等等。)聲音前處理技術(shù)其實(shí)是解決機(jī)器“聽(tīng)到”和“聽(tīng)清”兩件事,從而達(dá)到“聽(tīng)懂”的目的。聲音的“聽(tīng)到”主要依托的是麥克風(fēng)。主要形式為單個(gè)麥克風(fēng)或麥克風(fēng)陣列(多個(gè)麥克風(fēng)按照一定規(guī)則排列,在特定空間對(duì)聲音進(jìn)行獲取和處理)。而基于麥克風(fēng)的語(yǔ)音信號(hào)處理算法則是讓聲音“聽(tīng)懂”的關(guān)鍵。麥克風(fēng)+算法,在不同的環(huán)境下排列組合,最終達(dá)到“聽(tīng)到”和“聽(tīng)懂”。
聲音的后處理技術(shù),是聲音經(jīng)過(guò)存儲(chǔ)之后進(jìn)行播放的同時(shí)處理。是對(duì)音源例如 MP3 等媒體解碼播放的聲音進(jìn)音效增強(qiáng)處理(例如虛擬重低音、環(huán)繞立體聲、高音增強(qiáng)、EQ 等等)。聲音的前處理技術(shù),是聲音沒(méi)有進(jìn)入傳輸、沒(méi)有存儲(chǔ)之前的處理。聲音前處理目的,就是讓聲音的存儲(chǔ)、傳輸效率更高,識(shí)別率更好(例如回聲消除、降噪、聲音活動(dòng)檢測(cè)等等)。
在智能語(yǔ)音領(lǐng)域,炬芯已經(jīng)掌握了聲音前處理、聲音后處理的關(guān)鍵技術(shù),這些技術(shù)對(duì)于智能語(yǔ)音的發(fā)展無(wú)疑是非常重大的,而智能語(yǔ)音又是AIoT產(chǎn)業(yè)最關(guān)鍵的技術(shù)應(yīng)用。炬芯的這些語(yǔ)音交互技術(shù),可以推動(dòng)智能語(yǔ)音的市場(chǎng)發(fā)展,從而讓更多的AIoT設(shè)備落地。