2019年1月的AI語音芯片市場十分熱鬧,1月2日,云知聲召開發(fā)布會推出多模態(tài)AI芯片戰(zhàn)略,并公布今年布局的3款A(yù)I芯片。1月4日,思必馳召開發(fā)布會發(fā)布其第一代AI語音芯片TAIHANG。1月21日,獵豹移動旗下AI公司獵戶星空聯(lián)合瑞芯微電子宣布推出專門針對智能音箱和物聯(lián)網(wǎng)設(shè)備的AI語音芯片。
加上此前出門問問、Rokid已經(jīng)發(fā)布的AI語音芯片,AI語音芯片的競爭正在走向白熱化。這不禁讓人疑問,為什么AI公司或者說AI語音公司都開始爭相推出AI芯片?
研發(fā)AI語音芯片是自然趨勢
獵戶星空首席戰(zhàn)略官王兵博士接受我們專訪時表示,AI公司紛紛推出AI語音芯片有幾方面的原因,一方面是語音市場需求增長非??欤瑑H看智能音箱,去年整個市場的出貨量就超過2000萬,并且還在保持增長。另一方面,AI語音算法現(xiàn)在已經(jīng)相對比較成熟,做算法的輸出競爭已經(jīng)有點白熱化的狀態(tài),所以許多公司就開始研發(fā)芯片,因為芯片相對而言商業(yè)化的潛力更大,這是一個非常自然的趨勢。
他同時指出,由于AI語音芯片并不需要像AI視覺那么強的計算能力,也不需要最先進的工藝制程,因此相對而言AI語音芯片不僅研發(fā)的門檻低一些,開發(fā)周期也相對較短,這也是許多公司推出AI語音芯片的原因。
不過,獵戶星空最終決定研發(fā)AI芯片還有更多的考慮。此前獵豹移動董事長兼CEO傅盛接受采訪時提到推出AI芯片的兩方面考慮,第一,沒有針對某個AI場景的專用芯片,例如英偉達GPU是為游戲設(shè)計芯片,高通的SoC是為手機設(shè)計,為 AI 或者一些專屬設(shè)備設(shè)計的芯片很少。第二,如今 28nm工藝已經(jīng)很成熟,成本也非常低,做一款集成語音算法的芯片可能只有幾美金,流片幾百萬元人民幣。但在產(chǎn)品中加入這樣一塊芯片,主芯片的負載就可以明顯降低,用原來為手機設(shè)計的芯片光語音處理可能就要消耗40%的算力。
當然,獵戶星空能推出AI語音芯片也與自身的積累密不可分。王兵表示:“獵戶星空已掌握麥克風(fēng)陣列、語音喚醒、語音識別、語義理解和語音合成等全套遠場語音技術(shù),也擁有自研全鏈路的遠場語音交互系統(tǒng)獵戶語音OS,作為全技術(shù)鏈條的公司,芯片是必須涉足的領(lǐng)域,這有利于我們在垂直領(lǐng)域建立優(yōu)勢。同時,在中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)公布的國內(nèi)智能音箱智能化評級結(jié)果中,獵戶語音OS占據(jù)了獲評產(chǎn)品前五強中的三席,這說明了我們在語音市場的影響力。還有,實現(xiàn)芯片的自主可控也是大趨勢。因此,研發(fā)芯片成為了非常自然的事情?!?/p>
聯(lián)合研發(fā)AI語音芯片是好選擇
AI語音公司研發(fā)AI芯片是自然趨勢,芯片的研發(fā)卻可以有多種選擇,包括完全自主研發(fā)、聯(lián)合研發(fā)以及完全交由第三方設(shè)計。值得注意的是,獵戶星空選擇的方式是與瑞芯微聯(lián)合研發(fā),與此類似,思必馳與中芯國際下屬投資公司中芯聚源成立合資公司上海深聰智能聯(lián)合研發(fā)。這是否意味著聯(lián)合研發(fā)AI語音芯片是個好選擇?
對此,王兵表示:“對比而言,從開發(fā)周期和成本的角度,聯(lián)合研發(fā)確實是一個更好的方案。因為比較成熟的芯片公司已經(jīng)有積累,很多東西不需要重新去設(shè)計,能夠縮短開發(fā)周期,另外,對許多公司而言,芯片的生產(chǎn)和管理也沒必要親自介入?!?/p>
至于為什么選擇和瑞芯微合作,王兵表示,瑞芯微在低成本芯片方面有很多年的經(jīng)驗,我們評估了包括自行研發(fā)以及與其它廠商合作的方案之后,最終發(fā)現(xiàn)瑞芯微的方案成本最低,并且,我們的算法與他們的硬件能力的結(jié)合也比較合適。
具體的合作分工上,獵戶星空負責(zé)芯片架構(gòu)、算法以及系統(tǒng)軟件的設(shè)計,瑞芯微提供一些硬件的成熟方案以及對后期芯片的生產(chǎn)和管理。王兵表示,在合作的過程中,由于獵戶星空有有許多來自知名芯片公司經(jīng)驗豐富的工程師,因此他們對于芯片該如何去設(shè)計以及如何與瑞芯微溝通都非常清楚,雙方的合作還比較順利。
我們了解到,獵戶星空在2018年上半年啟動芯片項目,目前獵戶星空語音算法團隊的規(guī)模接近200人,芯片團隊包括軟件和系統(tǒng)團隊大約有30人。那么,從項目啟動到芯片正式推出時間還不到一年,獵戶星空的AI語音芯片競爭力如何?
芯片不一定最便宜,但一站式解決方案便宜且靈活
據(jù)了解,獵戶星空與瑞芯微聯(lián)合研發(fā)的AI語音芯片OS1000RK基于28nm工藝,采用64位4核ARM Cortex-A35 CPU,整合高性能 CODEC(8通道ADC+2通道DAC),可以低成本地支持8個麥克風(fēng)陣列,硬件語音檢測模塊(VAD)可實現(xiàn)很低的待機功能,專用指令集能讓神經(jīng)網(wǎng)絡(luò)的運行更加優(yōu)化。
OS1000RK主打功耗低、通用性強,能夠?qū)崿F(xiàn)從語音喚醒、語音理解、語音合成等全鏈條的語音交互能力。
另據(jù)了解,在功耗的降低方面OS1000RK的在沒有任何聲音的時候,除了VAD其他部分都不耗電,芯片還會根據(jù)需實現(xiàn)變頻工作,讓OS1000RK實現(xiàn)較低功耗。通用能力則是王兵重點強調(diào)的優(yōu)勢,他表示:“我們的AI芯片是一個通用性很強的產(chǎn)品,目前可以看到的規(guī)模較大的語音應(yīng)用,基本都可以用它來實現(xiàn),現(xiàn)在市面上還沒有其他AI語音芯片的通用能力特別強?!?/p>
“除了芯片,作為全鏈條AI公司,客戶需要什么算法我們都能提供,我認為目前行業(yè)內(nèi)其他人還不能做到這一點。這一能力來源于我們在算法上的巨大投入,還有數(shù)據(jù)的積累,獵戶星空從2016年成立之初就開始做語音的算法。”王兵補充道。
另外,有一個AI芯片公司都不得不面臨的問題就是AI算法的不斷更新。對此,王兵表示:“我們用互聯(lián)網(wǎng)的思維做硬件,我們不認為一個硬件出售之后功能就不會變,而是需要不斷更新,因此我們的芯片可以通過OTA在線更新,以此來保持芯片的競爭力?!?/p>
但是,芯片的通用性、性能和成本不可兼得。獵戶星空高通用性還能具備成本優(yōu)勢嗎?王兵指出,成本需要看系統(tǒng)成本,而不是只看芯片成本,這也是為什么我們要推出一站式解決方案的原因,這種模式能讓系統(tǒng)成本最低。也就是說,如果只強調(diào)硬件成本,做一款特別專用的芯片成本可能是最低,但靈活性不行,這將導(dǎo)致最終的系統(tǒng)不管是從性能還是成本的角度可能都比不過一站式的解決方案。因此,我們芯片不一定最便宜,但一站式解決方案一定是最便宜,而且是最靈活的。
王兵所指的一站式方案包括從芯片到芯片上的算法以及芯片上的系統(tǒng)軟件,再到云端的軟件、應(yīng)用軟件、內(nèi)容體系。他還舉例表示,如果有客戶想推出智能音箱,我們從電路板的設(shè)計到操作系統(tǒng)再到云端軟件的算法都可以提供,客戶基本上主要去做特定場景的內(nèi)容優(yōu)化以及渠道推廣就可以。
視覺AI芯片在自研路上
目前,OS1000RK已經(jīng)搭載在小雅Nano智能音箱中,預(yù)計將在今年年底達到百萬的出貨量。這也意味著獵戶星空的AI語音芯片今年底的出貨量將在百萬級別。王兵也表示:“從目前的訂單看我覺得百萬應(yīng)該沒有太大問題,我們下一代的小豹AI音箱也會搭載這款芯片。除了智能音箱,語音控制的智能家電,比如美的新一代的冰箱,兒童故事機、兒童教育機器人等其他機器人等都將采用我們的語音芯片。”
不僅僅是語音芯片,獵戶星空還在自主研發(fā)視覺、導(dǎo)航等更多領(lǐng)域的專用芯片。王兵表示,選擇自研的原因也是因為機器人視覺和導(dǎo)航還處于非常早期的階段,沒有特別好的專用芯片,自己研發(fā)能夠把性價比做到最優(yōu)。
至于視覺和導(dǎo)航芯片為什么選擇自研而不是聯(lián)合研發(fā),他表示,“語音芯片已經(jīng)有一些公司有積累,但視覺和導(dǎo)航到的芯片目前成熟的東西比較少,可能都需要自己設(shè)計,因此選擇自主研發(fā)。目前我們在這些領(lǐng)域我們也有了一些積累,也引進了一些資深人才?!?/p>
最后,在談到AI芯片熱潮以及資本寒冬是否會影響AI芯片公司的時候。王兵表示AI芯片是熱在投資階段,但AI芯片能夠真正量產(chǎn)和商業(yè)化的比較少。資本寒冬可能對于O2O或者互聯(lián)網(wǎng)領(lǐng)域會有影響,對AI、機器人、視覺、導(dǎo)航等不會有影響。
小結(jié)
AI芯片領(lǐng)域此前更受關(guān)注的是AI視覺芯片,但隨著語音算法競爭的白熱化,為了能夠保持競爭力并建立優(yōu)勢,越來越多的算法公司開始推出自研AI芯片。此時我們看到,包括獵戶星空和思必馳都采用聯(lián)合研發(fā)的方式而非完全自研,這在很大程度上證明了這種方式的可行性和性價比。
語音算法輸出以及AI芯片競爭的白熱化,讓更多AI語音的場景更成為各方爭奪的焦點,這也意味著我們離AI語音真正改變生活更近了一步。