未來語音芯片在AIoT道路上的發(fā)展情況如何
(文章來源:億歐網(wǎng))
所謂語音芯片,或者叫語音IC,是指一臺電子設(shè)備中負(fù)責(zé)發(fā)出聲音、收錄聲音的處理模塊。事實(shí)上,這東西在你的家中可謂無處不在。大到電視、電腦、音響,小到手機(jī)、錄音筆、音樂播放器,甚至電磁爐、冰箱、洗衣機(jī)發(fā)出的那一聲“滴”,背后也都需要專門的語音芯片來進(jìn)行控制。
這個領(lǐng)域聽上去沒什么技術(shù)含量,畢竟今天哪個設(shè)備還不會響呢?但事實(shí)上,其背后的設(shè)計(jì)技術(shù)和定制化生產(chǎn)能力,加上龐大的應(yīng)用數(shù)量附帶的低成本要求,多種因素導(dǎo)致了今天中國的語音芯片市場還是主要依靠進(jìn)口。目前,國內(nèi)語音芯片市場需求中,只有16%左右可以由國內(nèi)廠商來滿足。我國每年要進(jìn)口超過2000億美元的語音芯片產(chǎn)品,這個數(shù)字超過了我國每年原油進(jìn)口總額。
如果我們把這個情況帶入今天的中美貿(mào)易爭端大背景中,不難發(fā)現(xiàn)這又是一個并不安全的“卡脖子”產(chǎn)業(yè)。由于大量依賴進(jìn)口,缺乏底層設(shè)計(jì)技術(shù)和大規(guī)模量產(chǎn)能力,語音芯片一旦被卷入貿(mào)易莫測,很可能對半導(dǎo)體行業(yè),甚至整個電子產(chǎn)業(yè)帶來連鎖反應(yīng)。為了擺脫產(chǎn)業(yè)鏈下游的地位,這些年來中國相關(guān)產(chǎn)業(yè)也在進(jìn)行一系列行動。比如大規(guī)模收購美國和歐洲的語音芯片企業(yè)與專利技術(shù),但類似收購經(jīng)常被各種因素打斷,流產(chǎn)率遠(yuǎn)大于成功率。
另一方面,今天大陸市場購買的語音芯片,其實(shí)大部分產(chǎn)自日本、韓國和中國臺灣地區(qū)。在中美貿(mào)易戰(zhàn)的大背景下, 穩(wěn)固和發(fā)展與這些國家和地區(qū)的產(chǎn)業(yè)聯(lián)動關(guān)系,也就變得相對重要。這一領(lǐng)域人才的流動,近些年也成為大陸發(fā)展語音芯片的新動向。比如隨著臺灣地區(qū)經(jīng)濟(jì)發(fā)展放緩,大量臺灣的語音芯片人才選擇來大陸工作,客觀上成為推動大陸發(fā)展自身產(chǎn)業(yè)鏈的推助劑。
然而在眾多因素中,目前最有可能改變語音芯片全球貿(mào)易結(jié)構(gòu)的,其實(shí)還是新技術(shù)的崛起。從AI到5G,這些我們耳熟能詳?shù)拿直澈?,語音芯片迎來了不小的“變數(shù)”。我們知道,傳統(tǒng)意義上的語音芯片只負(fù)責(zé)錄音和播放聲音,其主要難度在于傳輸準(zhǔn)確率、信號穩(wěn)定性等方面。而這兩年一個新崛起的市場,卻讓“古老”的語音芯片,看到了變化的可能。
一般來說,芯片廠商的優(yōu)勢在于AI語音芯片其實(shí)并不需要特別難的技術(shù)門檻,而且對量產(chǎn)能力和成本把控能力具有相當(dāng)強(qiáng)的要求,這些都是芯片企業(yè)的強(qiáng)勢。而對于新技術(shù)的理解,尤其是對AI算法的融合,則成為了芯片廠商的短板,因此與AI公司的合作往往成為了今天的主流。
但是AI公司在芯片上的弱勢也是顯而易見的。AI語音芯片并不是個高凈值產(chǎn)品,往往必須依賴大量生產(chǎn)和大規(guī)模出貨才有可能盈利。而在集成化和工程能力上,AI公司顯然處于弱勢。目前AI獨(dú)角獸們的語音芯片計(jì)劃,更多還停留在對量產(chǎn)的肯定與承諾中。
而這里需要注意的是,AI+5G+IoT的組合,雖然打開了語音芯片的新想象力。但是在這個邏輯里,未來能占據(jù)廣泛市場的芯片模式,絕不是今天智能音箱芯片的模樣。語音芯片本身,變化才剛剛開始?;谏衔拿枋龅倪壿嫞磥碚Z音芯片的變革機(jī)會,將基于新網(wǎng)絡(luò)條件下的大批量、全場景設(shè)備擁抱AI。那么符合這樣邏輯的語音芯片產(chǎn)品事實(shí)上還沒有出現(xiàn)。而從這個角度看,行業(yè)的準(zhǔn)入證依舊沒有停止發(fā)放。
所謂三低,是指低成本、低功耗,低時延。5G時代的物聯(lián)網(wǎng)設(shè)備,理論上來說應(yīng)該是可以長時間待機(jī),盡量貼近可移動化的。因?yàn)樵O(shè)備將部署在海量并發(fā)場景,這也就讓語音芯片的基礎(chǔ)要求是足夠省電和足夠便宜。理想中下一個階段的語音芯片,是能夠隨時保持等待喚醒,但在等待喚醒狀態(tài)下極低能耗的。未來的物聯(lián)網(wǎng)芯片、語音芯片、視頻處理芯片,其實(shí)很大一部分競爭將圍繞三低展開。
在AI技術(shù)向產(chǎn)業(yè)化的發(fā)展中,今天一個很明顯的趨勢在于,多模態(tài)AI能力正在明顯提速。尤其是將語音識別、語義理解,與機(jī)器視覺任務(wù)相結(jié)合的AI模型。如果想要讓類似任務(wù)計(jì)算效率達(dá)成最優(yōu),那么在芯片端對多模態(tài)的加速就變得十分重要。也許未來我們需要的,是機(jī)器感官芯片,而非語音芯片或者多媒體芯片。
這些發(fā)展邏輯,各自對應(yīng)了新的技術(shù)挑戰(zhàn)與變化機(jī)遇。毫無疑問,今天中國的AI語音雖然看起來紅火,但距離大規(guī)模量產(chǎn)應(yīng)用,以及部分替代目前芯片進(jìn)口需求還有十分漫長的路要走。類似語音芯片的產(chǎn)業(yè),在中國還有千千萬萬。我們只能勉勵發(fā)展、聚攏人才,并謀求在新的技術(shù)劇變中發(fā)現(xiàn)調(diào)換座椅的機(jī)會。