視覺AI芯片在自研路上,AI語(yǔ)音芯片成研究焦點(diǎn)!
2019年1月的AI語(yǔ)音芯片市場(chǎng)十分熱鬧,1月2日,云知聲召開發(fā)布會(huì)推出多模態(tài)AI芯片戰(zhàn)略,并公布今年布局的3款A(yù)I芯片。1月4日,思必馳召開發(fā)布會(huì)發(fā)布其第一代AI語(yǔ)音芯片TAIHANG。1月21日,獵豹移動(dòng)旗下AI公司獵戶星空聯(lián)合瑞芯微電子宣布推出專門針對(duì)智能音箱和物聯(lián)網(wǎng)設(shè)備的AI語(yǔ)音芯片。
加上此前出門問問、Rokid已經(jīng)發(fā)布的AI語(yǔ)音芯片,AI語(yǔ)音芯片的競(jìng)爭(zhēng)正在走向白熱化。這不禁讓人疑問,為什么AI公司或者說AI語(yǔ)音公司都開始爭(zhēng)相推出AI芯片?
研發(fā)AI語(yǔ)音芯片是自然趨勢(shì)
獵戶星空首席戰(zhàn)略官王兵博士接受我們專訪時(shí)表示,AI公司紛紛推出AI語(yǔ)音芯片有幾方面的原因,一方面是語(yǔ)音市場(chǎng)需求增長(zhǎng)非???,僅看智能音箱,去年整個(gè)市場(chǎng)的出貨量就超過2000萬(wàn),并且還在保持增長(zhǎng)。另一方面,AI語(yǔ)音算法現(xiàn)在已經(jīng)相對(duì)比較成熟,做算法的輸出競(jìng)爭(zhēng)已經(jīng)有點(diǎn)白熱化的狀態(tài),所以許多公司就開始研發(fā)芯片,因?yàn)樾酒鄬?duì)而言商業(yè)化的潛力更大,這是一個(gè)非常自然的趨勢(shì)。
他同時(shí)指出,由于AI語(yǔ)音芯片并不需要像AI視覺那么強(qiáng)的計(jì)算能力,也不需要最先進(jìn)的工藝制程,因此相對(duì)而言AI語(yǔ)音芯片不僅研發(fā)的門檻低一些,開發(fā)周期也相對(duì)較短,這也是許多公司推出AI語(yǔ)音芯片的原因。
不過,獵戶星空最終決定研發(fā)AI芯片還有更多的考慮。此前獵豹移動(dòng)董事長(zhǎng)兼CEO傅盛接受采訪時(shí)提到推出AI芯片的兩方面考慮,第一,沒有針對(duì)某個(gè)AI場(chǎng)景的專用芯片,例如英偉達(dá)GPU是為游戲設(shè)計(jì)芯片,高通的SoC是為手機(jī)設(shè)計(jì),為 AI 或者一些專屬設(shè)備設(shè)計(jì)的芯片很少。第二,如今 28nm工藝已經(jīng)很成熟,成本也非常低,做一款集成語(yǔ)音算法的芯片可能只有幾美金,流片幾百萬(wàn)元人民幣。但在產(chǎn)品中加入這樣一塊芯片,主芯片的負(fù)載就可以明顯降低,用原來為手機(jī)設(shè)計(jì)的芯片光語(yǔ)音處理可能就要消耗40%的算力。
當(dāng)然,獵戶星空能推出AI語(yǔ)音芯片也與自身的積累密不可分。王兵表示:“獵戶星空已掌握麥克風(fēng)陣列、語(yǔ)音喚醒、語(yǔ)音識(shí)別、語(yǔ)義理解和語(yǔ)音合成等全套遠(yuǎn)場(chǎng)語(yǔ)音技術(shù),也擁有自研全鏈路的遠(yuǎn)場(chǎng)語(yǔ)音交互系統(tǒng)獵戶語(yǔ)音OS,作為全技術(shù)鏈條的公司,芯片是必須涉足的領(lǐng)域,這有利于我們?cè)诖怪鳖I(lǐng)域建立優(yōu)勢(shì)。同時(shí),在中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)公布的國(guó)內(nèi)智能音箱智能化評(píng)級(jí)結(jié)果中,獵戶語(yǔ)音OS占據(jù)了獲評(píng)產(chǎn)品前五強(qiáng)中的三席,這說明了我們?cè)谡Z(yǔ)音市場(chǎng)的影響力。還有,實(shí)現(xiàn)芯片的自主可控也是大趨勢(shì)。因此,研發(fā)芯片成為了非常自然的事情?!?/p>
聯(lián)合研發(fā)AI語(yǔ)音芯片是好選擇
AI語(yǔ)音公司研發(fā)AI芯片是自然趨勢(shì),芯片的研發(fā)卻可以有多種選擇,包括完全自主研發(fā)、聯(lián)合研發(fā)以及完全交由第三方設(shè)計(jì)。值得注意的是,獵戶星空選擇的方式是與瑞芯微聯(lián)合研發(fā),與此類似,思必馳與中芯國(guó)際下屬投資公司中芯聚源成立合資公司上海深聰智能聯(lián)合研發(fā)。這是否意味著聯(lián)合研發(fā)AI語(yǔ)音芯片是個(gè)好選擇?
對(duì)此,王兵表示:“對(duì)比而言,從開發(fā)周期和成本的角度,聯(lián)合研發(fā)確實(shí)是一個(gè)更好的方案。因?yàn)楸容^成熟的芯片公司已經(jīng)有積累,很多東西不需要重新去設(shè)計(jì),能夠縮短開發(fā)周期,另外,對(duì)許多公司而言,芯片的生產(chǎn)和管理也沒必要親自介入?!?/p>
至于為什么選擇和瑞芯微合作,王兵表示,瑞芯微在低成本芯片方面有很多年的經(jīng)驗(yàn),我們?cè)u(píng)估了包括自行研發(fā)以及與其它廠商合作的方案之后,最終發(fā)現(xiàn)瑞芯微的方案成本最低,并且,我們的算法與他們的硬件能力的結(jié)合也比較合適。
具體的合作分工上,獵戶星空負(fù)責(zé)芯片架構(gòu)、算法以及系統(tǒng)軟件的設(shè)計(jì),瑞芯微提供一些硬件的成熟方案以及對(duì)后期芯片的生產(chǎn)和管理。王兵表示,在合作的過程中,由于獵戶星空有有許多來自知名芯片公司經(jīng)驗(yàn)豐富的工程師,因此他們對(duì)于芯片該如何去設(shè)計(jì)以及如何與瑞芯微溝通都非常清楚,雙方的合作還比較順利。
我們了解到,獵戶星空在2018年上半年啟動(dòng)芯片項(xiàng)目,目前獵戶星空語(yǔ)音算法團(tuán)隊(duì)的規(guī)模接近200人,芯片團(tuán)隊(duì)包括軟件和系統(tǒng)團(tuán)隊(duì)大約有30人。那么,從項(xiàng)目啟動(dòng)到芯片正式推出時(shí)間還不到一年,獵戶星空的AI語(yǔ)音芯片競(jìng)爭(zhēng)力如何?
芯片不一定最便宜,但一站式解決方案便宜且靈活
據(jù)了解,獵戶星空與瑞芯微聯(lián)合研發(fā)的AI語(yǔ)音芯片OS1000RK基于28nm工藝,采用64位4核ARM Cortex-A35 CPU,整合高性能 CODEC(8通道ADC+2通道DAC),可以低成本地支持8個(gè)麥克風(fēng)陣列,硬件語(yǔ)音檢測(cè)模塊(VAD)可實(shí)現(xiàn)很低的待機(jī)功能,專用指令集能讓神經(jīng)網(wǎng)絡(luò)的運(yùn)行更加優(yōu)化。
OS1000RK主打功耗低、通用性強(qiáng),能夠?qū)崿F(xiàn)從語(yǔ)音喚醒、語(yǔ)音理解、語(yǔ)音合成等全鏈條的語(yǔ)音交互能力。
另?yè)?jù)了解,在功耗的降低方面OS1000RK的在沒有任何聲音的時(shí)候,除了VAD其他部分都不耗電,芯片還會(huì)根據(jù)需實(shí)現(xiàn)變頻工作,讓OS1000RK實(shí)現(xiàn)較低功耗。通用能力則是王兵重點(diǎn)強(qiáng)調(diào)的優(yōu)勢(shì),他表示:“我們的AI芯片是一個(gè)通用性很強(qiáng)的產(chǎn)品,目前可以看到的規(guī)模較大的語(yǔ)音應(yīng)用,基本都可以用它來實(shí)現(xiàn),現(xiàn)在市面上還沒有其他AI語(yǔ)音芯片的通用能力特別強(qiáng)?!?/p>
“除了芯片,作為全鏈條AI公司,客戶需要什么算法我們都能提供,我認(rèn)為目前行業(yè)內(nèi)其他人還不能做到這一點(diǎn)。這一能力來源于我們?cè)谒惴ㄉ系木薮笸度?,還有數(shù)據(jù)的積累,獵戶星空從2016年成立之初就開始做語(yǔ)音的算法?!蓖醣a(bǔ)充道。
另外,有一個(gè)AI芯片公司都不得不面臨的問題就是AI算法的不斷更新。對(duì)此,王兵表示:“我們用互聯(lián)網(wǎng)的思維做硬件,我們不認(rèn)為一個(gè)硬件出售之后功能就不會(huì)變,而是需要不斷更新,因此我們的芯片可以通過OTA在線更新,以此來保持芯片的競(jìng)爭(zhēng)力?!?/p>
但是,芯片的通用性、性能和成本不可兼得。獵戶星空高通用性還能具備成本優(yōu)勢(shì)嗎?王兵指出,成本需要看系統(tǒng)成本,而不是只看芯片成本,這也是為什么我們要推出一站式解決方案的原因,這種模式能讓系統(tǒng)成本最低。也就是說,如果只強(qiáng)調(diào)硬件成本,做一款特別專用的芯片成本可能是最低,但靈活性不行,這將導(dǎo)致最終的系統(tǒng)不管是從性能還是成本的角度可能都比不過一站式的解決方案。因此,我們芯片不一定最便宜,但一站式解決方案一定是最便宜,而且是最靈活的。
王兵所指的一站式方案包括從芯片到芯片上的算法以及芯片上的系統(tǒng)軟件,再到云端的軟件、應(yīng)用軟件、內(nèi)容體系。他還舉例表示,如果有客戶想推出智能音箱,我們從電路板的設(shè)計(jì)到操作系統(tǒng)再到云端軟件的算法都可以提供,客戶基本上主要去做特定場(chǎng)景的內(nèi)容優(yōu)化以及渠道推廣就可以。
視覺AI芯片在自研路上
目前,OS1000RK已經(jīng)搭載在小雅Nano智能音箱中,預(yù)計(jì)將在今年年底達(dá)到百萬(wàn)的出貨量。這也意味著獵戶星空的AI語(yǔ)音芯片今年底的出貨量將在百萬(wàn)級(jí)別。王兵也表示:“從目前的訂單看我覺得百萬(wàn)應(yīng)該沒有太大問題,我們下一代的小豹AI音箱也會(huì)搭載這款芯片。除了智能音箱,語(yǔ)音控制的智能家電,比如美的新一代的冰箱,兒童故事機(jī)、兒童教育機(jī)器人等其他機(jī)器人等都將采用我們的語(yǔ)音芯片?!?/p>
不僅僅是語(yǔ)音芯片,獵戶星空還在自主研發(fā)視覺、導(dǎo)航等更多領(lǐng)域的專用芯片。王兵表示,選擇自研的原因也是因?yàn)闄C(jī)器人視覺和導(dǎo)航還處于非常早期的階段,沒有特別好的專用芯片,自己研發(fā)能夠把性價(jià)比做到最優(yōu)。
至于視覺和導(dǎo)航芯片為什么選擇自研而不是聯(lián)合研發(fā),他表示,“語(yǔ)音芯片已經(jīng)有一些公司有積累,但視覺和導(dǎo)航到的芯片目前成熟的東西比較少,可能都需要自己設(shè)計(jì),因此選擇自主研發(fā)。目前我們?cè)谶@些領(lǐng)域我們也有了一些積累,也引進(jìn)了一些資深人才?!?/p>
最后,在談到AI芯片熱潮以及資本寒冬是否會(huì)影響AI芯片公司的時(shí)候。王兵表示AI芯片是熱在投資階段,但AI芯片能夠真正量產(chǎn)和商業(yè)化的比較少。資本寒冬可能對(duì)于O2O或者互聯(lián)網(wǎng)領(lǐng)域會(huì)有影響,對(duì)AI、機(jī)器人、視覺、導(dǎo)航等不會(huì)有影響。
小結(jié)
AI芯片領(lǐng)域此前更受關(guān)注的是AI視覺芯片,但隨著語(yǔ)音算法競(jìng)爭(zhēng)的白熱化,為了能夠保持競(jìng)爭(zhēng)力并建立優(yōu)勢(shì),越來越多的算法公司開始推出自研AI芯片。此時(shí)我們看到,包括獵戶星空和思必馳都采用聯(lián)合研發(fā)的方式而非完全自研,這在很大程度上證明了這種方式的可行性和性價(jià)比。
語(yǔ)音算法輸出以及AI芯片競(jìng)爭(zhēng)的白熱化,讓更多AI語(yǔ)音的場(chǎng)景更成為各方爭(zhēng)奪的焦點(diǎn),這也意味著我們離AI語(yǔ)音真正改變生活更近了一步。