智能語音產(chǎn)業(yè)需要什么技術(shù)的推動

時間：2020-05-11 22:18:01

關(guān)鍵字： AIOT 智能語音芯科回聲消除

手機(jī)看文章

掃描二維碼
隨時隨地手機(jī)看文章

[導(dǎo)讀] AIoT是指人工智能技術(shù)（AI）與物聯(lián)網(wǎng)（IoT）在實(shí)際應(yīng)用中的落地融合，AIoT 既是技術(shù)應(yīng)用，又是產(chǎn)業(yè)布局，AIoT是必然的發(fā)展趨勢。AIoT技術(shù)建構(gòu)一種更高級形式的智能化生態(tài)體系，即通過人

AIoT是指人工智能技術(shù)（AI）與物聯(lián)網(wǎng)（IoT）在實(shí)際應(yīng)用中的落地融合，AIoT 既是技術(shù)應(yīng)用，又是產(chǎn)業(yè)布局，AIoT是必然的發(fā)展趨勢。AIoT技術(shù)建構(gòu)一種更高級形式的智能化生態(tài)體系，即通過人工智能的方式實(shí)現(xiàn)萬物互融。

目前中國AIoT行業(yè)研究與運(yùn)用正處于高速進(jìn)步期，國務(wù)院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》提出，到2020年人工智能總體技術(shù)和應(yīng)用與世界先進(jìn)水平同步，核心產(chǎn)業(yè)規(guī)模超過1500億元，到2025年人工智能核心產(chǎn)業(yè)規(guī)模超過4000億元，到2030年人工智能核心產(chǎn)業(yè)規(guī)模超過1萬億元。隨著科技、制造等業(yè)界巨頭公司布局深入，以及眾多垂直領(lǐng)域的創(chuàng)業(yè)公司不斷誕生和成長，人工智能產(chǎn)業(yè)級和消費(fèi)級應(yīng)用精品將相繼誕生，滿足市場的需求。百度、騰訊、亞馬遜、阿里、喜馬拉雅、小米、美的、海爾等眾多行業(yè)巨頭都開始布局相關(guān)應(yīng)用。

在AIoT領(lǐng)域，一項(xiàng)重要的核心技術(shù)就是智能語音，對IoT設(shè)備影響最大的產(chǎn)品是智能語音，智能語音助手將對IoT設(shè)備帶來巨大的技術(shù)革命。實(shí)際上，智能語音，早已不是什么新鮮的事情，國外有如：蘋果Siri，微軟小娜，Google Assistant，亞馬遜的Alexa這樣的智能語音大咖。國內(nèi)有靈犀助手（科大訊飛），小度（百度），小愛同學(xué)（小米）這樣的后來跟進(jìn)者。智能語音的一項(xiàng)關(guān)鍵就是語音交互，而要做到語音交互，聲音的前后端處理缺一不可。

說到聲音處理技術(shù)，首先就會想到珠海炬芯科技，炬芯科技深耕聲音領(lǐng)域二十余年，被稱為國內(nèi)聲音前處理專家，在聲音前處理技術(shù)方面有著非常獨(dú)家的優(yōu)勢，在低功耗和聲音前處理技術(shù)上深有造詣。在拾音技術(shù)上已經(jīng)采用雙麥克風(fēng)整列，在離線和在線語音的處理方面也非常領(lǐng)先，同時也依賴于炬芯科技在行業(yè)二十余年的經(jīng)驗(yàn)和技術(shù)的積累。

炬芯科技在過去三十多年，一直在進(jìn)行聲音的處理工作，例如 MP3 （聲音的后處理技術(shù)）、錄音筆等聲音的保留、存儲（聲音的前處理），聲音的麥克風(fēng)識別，聲音的回聲消除及降噪（聲音的前處理）、后期的音效增強(qiáng)（聲音的后處理技術(shù)）等等。

根據(jù)炬芯技術(shù)市場專家陶永耀先生的解釋，聲音的前處理技術(shù)，是聲音沒有進(jìn)入傳輸、沒有存儲之前的處理。聲音前處理目的，就是讓聲音的存儲、傳輸效率更高，識別率更好。（例如回聲消除、降噪、聲音活動檢測等等。）聲音前處理技術(shù)其實(shí)是解決機(jī)器“聽到”和“聽清”兩件事，從而達(dá)到“聽懂”的目的。聲音的“聽到”主要依托的是麥克風(fēng)。主要形式為單個麥克風(fēng)或麥克風(fēng)陣列（多個麥克風(fēng)按照一定規(guī)則排列，在特定空間對聲音進(jìn)行獲取和處理）。而基于麥克風(fēng)的語音信號處理算法則是讓聲音“聽懂”的關(guān)鍵。麥克風(fēng)+算法，在不同的環(huán)境下排列組合，最終達(dá)到“聽到”和“聽懂”。

聲音的后處理技術(shù)，是聲音經(jīng)過存儲之后進(jìn)行播放的同時處理。是對音源例如 MP3 等媒體解碼播放的聲音進(jìn)音效增強(qiáng)處理（例如虛擬重低音、環(huán)繞立體聲、高音增強(qiáng)、EQ 等等）。聲音的前處理技術(shù)，是聲音沒有進(jìn)入傳輸、沒有存儲之前的處理。聲音前處理目的，就是讓聲音的存儲、傳輸效率更高，識別率更好（例如回聲消除、降噪、聲音活動檢測等等）。

在智能語音領(lǐng)域，炬芯已經(jīng)掌握了聲音前處理、聲音后處理的關(guān)鍵技術(shù)，這些技術(shù)對于智能語音的發(fā)展無疑是非常重大的，而智能語音又是AIoT產(chǎn)業(yè)最關(guān)鍵的技術(shù)應(yīng)用。炬芯的這些語音交互技術(shù)，可以推動智能語音的市場發(fā)展，從而讓更多的AIoT設(shè)備落地。