未來(lái)語(yǔ)音芯片在AIoT道路上的發(fā)展情況如何

時(shí)間：2020-05-23 10:57:01

關(guān)鍵字：語(yǔ)音芯片 AIOT 多模芯片市場(chǎng)

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] （文章來(lái)源：億歐網(wǎng)）所謂語(yǔ)音芯片，或者叫語(yǔ)音IC，是指一臺(tái)電子設(shè)備中負(fù)責(zé)發(fā)出聲音、收錄聲音的處理模塊。事實(shí)上，這東西在你的家中可謂無(wú)處不在。大到電視、電腦、音響，小到手機(jī)、錄音筆、音樂

（文章來(lái)源：億歐網(wǎng)）

所謂語(yǔ)音芯片，或者叫語(yǔ)音IC，是指一臺(tái)電子設(shè)備中負(fù)責(zé)發(fā)出聲音、收錄聲音的處理模塊。事實(shí)上，這東西在你的家中可謂無(wú)處不在。大到電視、電腦、音響，小到手機(jī)、錄音筆、音樂播放器，甚至電磁爐、冰箱、洗衣機(jī)發(fā)出的那一聲“滴”，背后也都需要專門的語(yǔ)音芯片來(lái)進(jìn)行控制。

這個(gè)領(lǐng)域聽上去沒什么技術(shù)含量，畢竟今天哪個(gè)設(shè)備還不會(huì)響呢？但事實(shí)上，其背后的設(shè)計(jì)技術(shù)和定制化生產(chǎn)能力，加上龐大的應(yīng)用數(shù)量附帶的低成本要求，多種因素導(dǎo)致了今天中國(guó)的語(yǔ)音芯片市場(chǎng)還是主要依靠進(jìn)口。目前，國(guó)內(nèi)語(yǔ)音芯片市場(chǎng)需求中，只有16%左右可以由國(guó)內(nèi)廠商來(lái)滿足。我國(guó)每年要進(jìn)口超過(guò)2000億美元的語(yǔ)音芯片產(chǎn)品，這個(gè)數(shù)字超過(guò)了我國(guó)每年原油進(jìn)口總額。

如果我們把這個(gè)情況帶入今天的中美貿(mào)易爭(zhēng)端大背景中，不難發(fā)現(xiàn)這又是一個(gè)并不安全的“卡脖子”產(chǎn)業(yè)。由于大量依賴進(jìn)口，缺乏底層設(shè)計(jì)技術(shù)和大規(guī)模量產(chǎn)能力，語(yǔ)音芯片一旦被卷入貿(mào)易莫測(cè)，很可能對(duì)半導(dǎo)體行業(yè)，甚至整個(gè)電子產(chǎn)業(yè)帶來(lái)連鎖反應(yīng)。為了擺脫產(chǎn)業(yè)鏈下游的地位，這些年來(lái)中國(guó)相關(guān)產(chǎn)業(yè)也在進(jìn)行一系列行動(dòng)。比如大規(guī)模收購(gòu)美國(guó)和歐洲的語(yǔ)音芯片企業(yè)與專利技術(shù)，但類似收購(gòu)經(jīng)常被各種因素打斷，流產(chǎn)率遠(yuǎn)大于成功率。

另一方面，今天大陸市場(chǎng)購(gòu)買的語(yǔ)音芯片，其實(shí)大部分產(chǎn)自日本、韓國(guó)和中國(guó)臺(tái)灣地區(qū)。在中美貿(mào)易戰(zhàn)的大背景下，穩(wěn)固和發(fā)展與這些國(guó)家和地區(qū)的產(chǎn)業(yè)聯(lián)動(dòng)關(guān)系，也就變得相對(duì)重要。這一領(lǐng)域人才的流動(dòng)，近些年也成為大陸發(fā)展語(yǔ)音芯片的新動(dòng)向。比如隨著臺(tái)灣地區(qū)經(jīng)濟(jì)發(fā)展放緩，大量臺(tái)灣的語(yǔ)音芯片人才選擇來(lái)大陸工作，客觀上成為推動(dòng)大陸發(fā)展自身產(chǎn)業(yè)鏈的推助劑。

然而在眾多因素中，目前最有可能改變語(yǔ)音芯片全球貿(mào)易結(jié)構(gòu)的，其實(shí)還是新技術(shù)的崛起。從AI到5G，這些我們耳熟能詳?shù)拿直澈?，語(yǔ)音芯片迎來(lái)了不小的“變數(shù)”。我們知道，傳統(tǒng)意義上的語(yǔ)音芯片只負(fù)責(zé)錄音和播放聲音，其主要難度在于傳輸準(zhǔn)確率、信號(hào)穩(wěn)定性等方面。而這兩年一個(gè)新崛起的市場(chǎng)，卻讓“古老”的語(yǔ)音芯片，看到了變化的可能。

一般來(lái)說(shuō)，芯片廠商的優(yōu)勢(shì)在于AI語(yǔ)音芯片其實(shí)并不需要特別難的技術(shù)門檻，而且對(duì)量產(chǎn)能力和成本把控能力具有相當(dāng)強(qiáng)的要求，這些都是芯片企業(yè)的強(qiáng)勢(shì)。而對(duì)于新技術(shù)的理解，尤其是對(duì)AI算法的融合，則成為了芯片廠商的短板，因此與AI公司的合作往往成為了今天的主流。

但是AI公司在芯片上的弱勢(shì)也是顯而易見的。AI語(yǔ)音芯片并不是個(gè)高凈值產(chǎn)品，往往必須依賴大量生產(chǎn)和大規(guī)模出貨才有可能盈利。而在集成化和工程能力上，AI公司顯然處于弱勢(shì)。目前AI獨(dú)角獸們的語(yǔ)音芯片計(jì)劃，更多還停留在對(duì)量產(chǎn)的肯定與承諾中。

而這里需要注意的是，AI+5G+IoT的組合，雖然打開了語(yǔ)音芯片的新想象力。但是在這個(gè)邏輯里，未來(lái)能占據(jù)廣泛市場(chǎng)的芯片模式，絕不是今天智能音箱芯片的模樣。語(yǔ)音芯片本身，變化才剛剛開始。基于上文描述的邏輯，未來(lái)語(yǔ)音芯片的變革機(jī)會(huì)，將基于新網(wǎng)絡(luò)條件下的大批量、全場(chǎng)景設(shè)備擁抱AI。那么符合這樣邏輯的語(yǔ)音芯片產(chǎn)品事實(shí)上還沒有出現(xiàn)。而從這個(gè)角度看，行業(yè)的準(zhǔn)入證依舊沒有停止發(fā)放。

所謂三低，是指低成本、低功耗，低時(shí)延。5G時(shí)代的物聯(lián)網(wǎng)設(shè)備，理論上來(lái)說(shuō)應(yīng)該是可以長(zhǎng)時(shí)間待機(jī)，盡量貼近可移動(dòng)化的。因?yàn)樵O(shè)備將部署在海量并發(fā)場(chǎng)景，這也就讓語(yǔ)音芯片的基礎(chǔ)要求是足夠省電和足夠便宜。理想中下一個(gè)階段的語(yǔ)音芯片，是能夠隨時(shí)保持等待喚醒，但在等待喚醒狀態(tài)下極低能耗的。未來(lái)的物聯(lián)網(wǎng)芯片、語(yǔ)音芯片、視頻處理芯片，其實(shí)很大一部分競(jìng)爭(zhēng)將圍繞三低展開。

在AI技術(shù)向產(chǎn)業(yè)化的發(fā)展中，今天一個(gè)很明顯的趨勢(shì)在于，多模態(tài)AI能力正在明顯提速。尤其是將語(yǔ)音識(shí)別、語(yǔ)義理解，與機(jī)器視覺任務(wù)相結(jié)合的AI模型。如果想要讓類似任務(wù)計(jì)算效率達(dá)成最優(yōu)，那么在芯片端對(duì)多模態(tài)的加速就變得十分重要。也許未來(lái)我們需要的，是機(jī)器感官芯片，而非語(yǔ)音芯片或者多媒體芯片。

這些發(fā)展邏輯，各自對(duì)應(yīng)了新的技術(shù)挑戰(zhàn)與變化機(jī)遇。毫無(wú)疑問，今天中國(guó)的AI語(yǔ)音雖然看起來(lái)紅火，但距離大規(guī)模量產(chǎn)應(yīng)用，以及部分替代目前芯片進(jìn)口需求還有十分漫長(zhǎng)的路要走。類似語(yǔ)音芯片的產(chǎn)業(yè)，在中國(guó)還有千千萬(wàn)萬(wàn)。我們只能勉勵(lì)發(fā)展、聚攏人才，并謀求在新的技術(shù)劇變中發(fā)現(xiàn)調(diào)換座椅的機(jī)會(huì)。