語音公司集體殺入AI芯片 2019場景落地戰(zhàn)打響!
本文來自智東西微信號,作者:寓揚。本文作為轉(zhuǎn)載分享。
2019年的第一個工作日,在第一顆AI芯片“雨燕”落地不久,AI創(chuàng)業(yè)公司云知聲緊鑼密鼓地推出多模態(tài)AI芯片戰(zhàn)略,并公布今年3款A(yù)I芯片日程表。
緊接著的1月4日,另一家語音公司思必馳成立獨立控股公司,推出TAIHANG AI芯片,搶占終端語音交互市場。
這還沒完,1月21日,獵豹移動旗下AI公司獵戶星空聯(lián)合瑞芯微電子發(fā)布專門針對智能語音和物聯(lián)網(wǎng)設(shè)備的AI芯片——OS1000RK。其官方稱,該芯片已經(jīng)成功落地到數(shù)十萬臺智能音箱——小雅Nano中,并預(yù)計將在今年年底達到百萬級出貨量。
短短不到1個月時間,就有3家以語音起家的AI公司殺入AI芯片市場,推動戰(zhàn)火升級。而這背后是語音公司集體涌入AI芯片市場,這將會是2019年AI落地的一大浪潮。
語音公司涌入AI芯片主要玩家
但語音公司集體涌入AI芯片浪潮背后,他們到底做的是什么?他們?yōu)槭裁匆鯝I芯片,又為什么是他們最先涌現(xiàn)出來?AI芯片之爭爭奪的真的是芯片本身嗎?帶著種種疑問,智東西走訪這一行業(yè)主要玩家,為您一一揭開謎底。
如果說2018年被行業(yè)稱為AI芯片的元年,那么2019年就是AI芯片真正走向落地、經(jīng)受市場洗禮的一年。
語音公司集體涌入AI芯片浪潮
隨著2017年國內(nèi)智能音箱的火熱,語音交互技術(shù)開始走向前臺,落地到越來越多的智能終端設(shè)備中,也為AI芯片的到來埋下了一顆種子。
2018年3月,語音技術(shù)公司聲智科技推出了一款麥克風陣列芯片SAI101C,這是一款聲學芯片,它集成了優(yōu)化過的低功耗喚醒以及遠場自動語音識別技術(shù),支持多種麥克風陣列,能夠與主控芯片配合,讓設(shè)備具備遠場拾音能力,應(yīng)用智能音箱、智能電視、智能玩具等市場。
盡管它還算不上一款A(yù)I芯片,但代表著語音公司面向終端設(shè)備,聚焦在“耳朵”功能——麥克風陣列上的一次探索。
2018年5月,兩家AI公司涌入AI芯片賽道。先是云知聲宣布推出針對智能家居場景的語音AI芯片“雨燕”,當時云知聲創(chuàng)始人、CEO黃偉稱這款芯片已經(jīng)成功流片,將在2018年第二季度量產(chǎn)。
據(jù)稱,這款A(yù)I芯片由云知聲自主研發(fā)設(shè)計,擁有具備自主知識產(chǎn)權(quán)的DeepNet(人工智能核心IP)、DSP(數(shù)字信號處理) 、支持DNN/LSTM/CNN等多種深度神經(jīng)網(wǎng)絡(luò)模型,以及多種應(yīng)用接口,其性能比通用方案提升50倍。
當月,出門問問也推出一款A(yù)I語音芯片模組“問芯”。它融合了杭州國芯的語音前端芯片GX8008,與出門問問的麥克風陣列信號處理技術(shù)等,從模組層面探索B端市場。
緊接著的6月份,Rokid在其成立4年來的首場發(fā)布會中,發(fā)布了語音AI芯片KAMINO18。這款芯片由杭州國芯定制,Rokid主要做芯片的架構(gòu)優(yōu)化,以及NPU指令集的設(shè)定,采用40納米工藝,由臺積電代工生產(chǎn)。
Rokid CEO祝銘明當時表示,盡管這款芯片為40納米,卻比上一代Pebble音箱中16納米的芯片算力提升1.5倍。此外,這款A(yù)I芯片的整體成本低于市場主流通用芯片方案30%。
他還透露,“已經(jīng)訂下的訂單就有幾百萬片芯片了”,小雅mini兒童音箱與甘布兒童產(chǎn)品都使用這款芯片。
2018年下半年,語音芯片問世的節(jié)奏相對緩和一些,但廠商之間的競爭明顯在加劇。思必馳、云知聲等公司不斷向外界透露AI芯片的最新進展,摩拳擦掌競爭的火花在蔓延。
而在2019年的第一周,兩家公司紛紛舉辦發(fā)布會,發(fā)布AI芯片產(chǎn)品,展開“貼身肉搏”。
云知聲公布了其多模態(tài)的AI芯片戰(zhàn)略,并宣布2019年將會面向語音、視覺、車載等場景推出3款A(yù)I芯片,搶灘IoT場景。
隨后,思必馳的語音AI芯片也與大家見面,它采用專用芯片+高性能DSP+擴展指令集的架構(gòu),具備低功耗、高能效、高性價比等優(yōu)勢,同時支持多種接口、多麥克風陣列,可應(yīng)用在電視、白電、車載、機器人、智能音箱等場景。
這款A(yù)I芯片由思必馳控股的獨立公司上海深聰智能打造,深聰智能CTO朱澄宇告訴智東西,這款A(yù)I芯片的定位前端語音交互的專用芯片,核心在于為設(shè)備賦予語音能力。
緊接著,獵豹移動也宣布,旗下AI公司獵戶星空聯(lián)合瑞芯微電子發(fā)布針對智能語音和物聯(lián)網(wǎng)設(shè)備的AI芯片,它整合了8通道ADC+2通道DAC(數(shù)模/模數(shù)轉(zhuǎn)換芯片),可支持8麥克風陣列,專用指令集可以加速神經(jīng)網(wǎng)絡(luò)算法。
此外,訊飛系的AI芯片也在路上。至此,語音算法公司掀起了集體涌入AI芯片的浪潮。
語音公司做芯片,做的到底是什么?
每一家語音公司做芯片后,我都會問他們,語音公司做芯片到底是做的什么。
Rokid CEO祝銘明談道,Rokid不是一家芯片公司,不是為做芯片而坐芯片,也不靠芯片賺錢。Rokid更注重通過芯片來提供足夠的算力,實現(xiàn)芯片與算法更好的匹配,并降低成本,核心在于輸出解決方案。
因此,Rokid采取與杭州國芯合作的方式,Rokid主要做芯片的架構(gòu)優(yōu)化,以及NPU的指令集設(shè)定,在芯片層面則交由杭州國芯定制。
但云知聲CEO黃偉顯然不認同這一模式,他認為行業(yè)做AI芯片有三種做法,第一種是PPT造芯,第二種是合作的方式,第三種才是自研。
他認為與外部公司合作造芯并不是最好的一種方式,比如一方是做芯片的,一方是做算法的,很難在源代碼層面做到很好的耦合。因此云知聲選擇了成立子公司,自研AI芯片的做法。具體而言,在AI芯片中,云知聲主要做的是DSP與人工智能核心IP DeepNet。
選擇獨立公司方式來打造AI芯片的還有思必馳。思必馳CTO周偉達更進一步表示,語音公司做與不做芯片是按需求來的,思必馳做AI芯片的核心目的是,面向客戶需求,通過軟件定義硬件,軟硬件耦合的思路來構(gòu)建思必馳在算法方案上的優(yōu)勢。
聯(lián)發(fā)科技副總經(jīng)理暨智能設(shè)備事業(yè)群總經(jīng)理游人杰則一針見血地指出,每一家語音公司的算法都不同,需要對芯片硬件架構(gòu)做耦合,才能夠產(chǎn)生更好的效果與效能,這是語音創(chuàng)業(yè)公司做AI芯片的一個主要原因。
他進一步指出,像科大訊飛、思必馳做語音芯片更主要在于做DSP(數(shù)字信號處理)。目前用CPU、AP芯片(應(yīng)用處理器芯片)來做的方案,功耗比較高。
可見正是通用芯片在實際應(yīng)用場景中的不足,無論是出于功耗、性能、成本等的各方面考量,語音公司涌入這一賽道,通過軟硬件耦合的方式,來進一步確立在語音核心算法的優(yōu)勢。
為何要做AI芯片?
去年5月,云知聲CEO黃偉曾說,“不做芯片,必死無疑”;隨后,Rokid CEO祝銘明也回應(yīng)道,“做語音的公司,毋庸置疑,一定要做芯片”;緊接著,思必馳CEO高始興則稱,做語音芯片是“順勢而為”。
那么,語音公司要做AI芯片背后的原因究竟是什么呢?
云知聲CEO黃偉從市場需求與核心競爭力談道,2014年當時做模組的時候,希望賦予場景語音交互的能力,但是發(fā)現(xiàn)市面上沒有任何能夠滿足需求的芯片,并且拼湊出來的成本非常高。因此他很早就意識到了做芯片的必要性,并在2015年開始打造AI芯片。
他之所以說云知聲不做芯片必死無疑,是因為語音公司的核心競爭力,必須在場景中打通,只有軟硬件結(jié)合的方式才能夠?qū)崿F(xiàn)。
思必馳CEO高始興也告訴智東西,隨著整個物聯(lián)網(wǎng)終端的爆發(fā),行業(yè)對語音芯片的需求也進一步呈現(xiàn),而思必馳在之前提供語音方案的過程中跟多家芯片做過對接,知道需求在哪里,自身做AI芯片本身,也有較大的業(yè)務(wù)體量做支撐。
并且,思必馳自己做芯片,芯片架構(gòu)能夠根據(jù)算法、算力做定制調(diào)整,算法也能根據(jù)芯片做優(yōu)化,將芯和云端打通從而提供更優(yōu)的性能與體驗。
此外,他還從成本與低功耗的角度談道,傳統(tǒng)芯片在成本與功耗上都非常高,物聯(lián)網(wǎng)終端更加講求性價比,而自身打造語音芯片能夠?qū)崿F(xiàn)成本與功耗的最優(yōu)化。
總結(jié)起來看,語音公司做AI芯片背后無外乎幾大原因:提供充足算力,滿足場景需求;降低芯片以及方案整體成本;智能家居IoT場景存在低功耗需求;而核心則指向通過軟硬件一體構(gòu)建算法核心競爭力,從而構(gòu)建競爭壁壘,形成更閉環(huán)的商業(yè)模式與盈利能力。
為什么是他們最先涌入AI芯片?
對比傳統(tǒng)芯片企業(yè)、芯片巨頭可以發(fā)現(xiàn),語音公司率先涌入終端AI芯片賽道,并率先推出產(chǎn)品,而芯片巨頭在AI芯片尤其是語音AI芯片上還并無太多進展。
為什么又是語音公司率先涌入AI芯片賽道?
思必馳CTO周偉達以自身實踐經(jīng)歷談道,語音公司在技術(shù)服務(wù)產(chǎn)業(yè)的思路下,對接了大量客戶,也對接了各種芯片平臺,因此語音公司更清楚市場需要什么,目前市面已有的芯片能夠做什么,不能夠做什么,缺少哪些功能等。
從語音算法的角度來說,語音技術(shù)對硬件有一定需求,需要一款高能效、低功耗、降低成本,同時又能夠改善體驗的芯片。
因此他認為,語音算法公司最了解算法,又了解市場需求,能夠做出能效最高的芯片,所以語音公司會率先做芯片。
周偉達從打造AI芯片的兩種路徑來看,一種是從硬件出發(fā)做AI芯片,但如果公司對AI算法不夠了解,往往很難做出滿足場景最優(yōu)的芯片;另一類是算法公司,根據(jù)算法、場景的需求,結(jié)合硬件做優(yōu)化。
盡管二者做AI芯片都有挑戰(zhàn),當相對而言,語音算法公司做AI芯片更有優(yōu)勢。
此外,他認為在AI芯片的行業(yè)早期階段,當下AI算法還不夠成熟,需要芯片硬件和AI算法的聯(lián)合研發(fā)。
但隨著AI算法的成熟,一定會有芯片公司涌入,并且只需要告訴芯片公司我們需要多少算力、多少帶寬、多少存儲、多少功耗,芯片公司就能夠?qū)崿F(xiàn),但目前還無法做到。
市場競爭才剛剛開始
盡管語音公司在技術(shù)落地的過程中,對于算法和市場需求有更多的了解,并且率先發(fā)力AI芯片,走到了行業(yè)前面,但語音公司所面臨的競爭才剛剛開始。
其一,看到IoT場景下端側(cè)智能的市場前景,芯片公司也在積極布局AI芯片,比如2017年前后,杭州國芯、啟英泰倫都推出了語音AI芯片,試圖探索IoT場景。
再比如,脫胎于清華大學微納電子系的清微智能,面向邊緣設(shè)備和物聯(lián)網(wǎng)提供芯片以及軟件等解決方案。今年上半年清微智能的業(yè)務(wù)將集中在語音芯片,預(yù)計產(chǎn)量在千萬級。
其二,隨著AI算法的成熟,以及IoT市場對AI芯片的需求進一步爆發(fā),芯片巨頭必將會大規(guī)模涌入這一領(lǐng)域,一旦芯片巨頭進入,將會對語音公司帶來巨大的挑戰(zhàn)。比如目前高通在IoT場景下進行了重點布局。
而這些都構(gòu)成了語音公司布局AI芯片的外部競爭。
其三,語音公司內(nèi)部的競爭也尤為激烈。語音公司布局AI芯片,正是想通過軟硬件一體化的方式,匹配充足是算力、功耗等,降低成本,進一步增長自身AI算法與方案的競爭力。
其四是AI芯片落地場景的考驗。目前各家語音公司的AI芯片剛剛推出,或者剛剛開始落地產(chǎn)品、落地場景,芯片能否真正工程化應(yīng)用于產(chǎn)品,能否真正滿足實際場景需求,以及芯片的穩(wěn)定性等都是有待考驗的地方。
2019年正是檢驗AI芯片落地的一年,誰能夠真正落地場景,形成規(guī)模,誰就有可能在未來的競爭中勝出。
此外,行業(yè)也有一種觀點,AI芯片至于物聯(lián)網(wǎng)場景未必是必要的,這一觀點認為物聯(lián)網(wǎng)場景中存在很多不需要太多算力的設(shè)備,并且隨著通用芯片的升級也能夠滿足這一需求。
面向終端側(cè),到底AI芯片能夠在哪些行業(yè)場景爆發(fā),都是有待驗證的難題,也都需要語音公司以及行業(yè)進一步探索。
結(jié)語:2019AI芯片場景落地戰(zhàn)打響
僅僅是2019年剛剛開年,我們就看到了數(shù)款A(yù)I芯片的亮相,這代表了AI公司場景落地的深化。
盡管各家都涌入了AI芯片這一賽道,各家的產(chǎn)品也都陸續(xù)推出,但產(chǎn)品推出只是第一步,緊接著落地場景才是真正的考驗。
如果說2018年是AI芯片的元年,那么2019年將會是AI芯片打響場景落地戰(zhàn)的一年。
只有經(jīng)受場景與市場的考驗,真正解決現(xiàn)實場景的實際痛點,才能真正被行業(yè)與市場認可,而這一戰(zhàn)役剛剛開始。