進入 2019 年, AI 技術(shù)的場景落地和商用化會成為一個更迫切的議題,但語音識別已是所有 AI 技術(shù)中最成功的領(lǐng)域,眼前有四大AI語音公司思必馳、云知聲、Rokid 、出門問問不約而同投入“造芯”運動,開始押寶自制 AI 語音芯片,開啟第二戰(zhàn)場!
“融資”與“造芯”成為 AI 創(chuàng)業(yè)公司兩大主軸議題,思必馳在 2018 年完成 D 輪融資后,即透露與某芯片巨頭進行 AI 芯片的研發(fā),如今答案揭曉,思必馳旗下的芯片設(shè)計公司“深聰”獲得“國家隊”中芯國際旗下的股權(quán)管理公司中芯聚源投資,同時中芯國際也為深聰打造第一顆 AI 語音芯片。
“百箱大戰(zhàn)”時代開啟 ,AI 語音芯片熱度火到“互撕”?
基于深度學(xué)習(xí)( Deep Learning )的語音辨識技術(shù)很快成為 AI 創(chuàng)業(yè)界的流量擔(dān)當(dāng),尤其 2017 年 Amazon 一口氣推出多款Echo系列產(chǎn)品,開始了國內(nèi)“百箱大戰(zhàn)”的年代,更讓相關(guān) AI 語音企業(yè)迎來一陣小高潮,不少同性質(zhì)公司更是明爭暗斗陷入“互撕”局面,反應(yīng)該市場的火熱程度。
根據(jù) Canalys 估計, 2017 年全球智能音箱出貨量突破 3000 萬臺, 2018 年出貨量預(yù)計是超過 5600 萬臺,全球前四大品牌廠為Google、Amazon、天貓、小米。再者, 2017 年全球智能音箱用戶量排名前五名是美國、英國、德國、中國、加拿大,但2018年中國可望躍居第二名。
除了音箱之外,智能家居、汽車市場很多應(yīng)用場景的硬件也會陸續(xù)加入語音智能化的功能,都讓 AI 語音技術(shù)的應(yīng)用場景增添無限想像空間。
光是 2018 年就有三家 AI 語音創(chuàng)業(yè)公司發(fā)表相關(guān)芯片,包括云知聲發(fā)表面向 AIoT 市場的 UniOne 芯片、出門問問的 AI 語音芯片模組“問芯”Mobvoi A1、 Rokid 的 AI 語音芯片 KAMINO 18 ,思必馳透露要進入自制芯片領(lǐng)域已有一段時間,4日才正式對外揭露具體戰(zhàn)略細(xì)節(jié)。
中芯國際助陣,思必馳“造芯”如虎添翼
不同于云知聲、Rokid進入芯片自制領(lǐng)域,都是在公司內(nèi)部成立獨立部門進行研發(fā),思必馳2018年初成立子公司“深聰”,2019年初推出的第一顆產(chǎn)品是AI語音芯片深聰TAIHANG芯片。
思必馳扶植的深聰之所以引起業(yè)界注意,是因為思必馳的“造芯”之路,找來國內(nèi)半導(dǎo)體巨頭中芯國際助力,旗下的投資公司中芯聚源加入成為創(chuàng)始股東之一。再者,思必馳對深聰?shù)某止杀戎爻^50%。
思必馳自制的首顆AI語音芯片,就是由中芯國際操刀,以40納米工藝打造,約莫是2017年中啟動該芯片項目后,在2018年8月進行流片,11月芯片出來后,現(xiàn)在處于采集樣本階段,預(yù)計2019年中將進入風(fēng)險試產(chǎn),該顆芯片拔劍出鞘的速度十分快,幾乎把需要6 個季度的工作,縮短為3個季度完成。
深聰TAIHANG芯片面向智能家居、智能終端、車載、手機、可穿戴設(shè)備等各類終端設(shè)備,基于雙DSP架構(gòu),內(nèi)部集成codec編解碼器,以及大容量的內(nèi)置存儲單元,再者,該芯片也采用了指令集擴展和算法硬件加速的手段,相較于傳統(tǒng)通用芯片具有10X以上的效率提升。
深聰聯(lián)合創(chuàng)始人吳耿源表示,在芯片戰(zhàn)略上是兩步走,因為背后強大的需求力道驅(qū)動,第一顆芯片不單是求快,講求time-to-market,也專注低功耗、單向反愧實現(xiàn)算法加硬件融合優(yōu)化的想法。
同時,深聰內(nèi)部已經(jīng)開始第二顆芯片的規(guī)劃,是專用芯片加特定架購,雙向溝通更能達(dá)到軟硬件融合、深度優(yōu)化的功效提升,以軟件需求來定義芯片架構(gòu),再用架構(gòu)去反饋算法,同時,算法也會優(yōu)化硬體架構(gòu),等于是彼此做到雙向溝通,預(yù)計該顆芯片將在2019年下半年流片,2020年量產(chǎn)。
從“通用”到“專用”,這是一條怎么樣的心路歷程?
從通用芯片到量身打造專用芯片的過程,想必有一番思考、摸索與探尋,吳耿源接受DT君專訪時娓娓道來。
吳耿源分析,思必馳是一家滿十歲的企業(yè),這幾年趕上AI崛起的浪潮,過去多年的技術(shù)積累獲得發(fā)力的機會,目標(biāo)戰(zhàn)場是物聯(lián)網(wǎng),第一個應(yīng)用場景是智能音箱,一切有了很美好的揭幕,但坦白說,智能音箱終究“ me too ”產(chǎn)品,Amazon 已經(jīng)在前開路。
思必馳的智能音箱初期用過很多家芯片大廠的通用芯片,但隨著產(chǎn)品線逐漸成長茁壯后,許多問題逐一浮現(xiàn)。因為,通用芯片功能再怎么強大,落地到AI場景上會有削足適履之感,加上很多目標(biāo)市場越來越明確、消費者群聚效應(yīng)展現(xiàn)后,特制化芯片的需求因此誕生。
AI 芯片在市場上有兩路的提供者,早幾年都是通用芯片的天下,像是高通、聯(lián)發(fā)科等,這些巨頭在芯片戰(zhàn)略上,較為著眼于商業(yè)利益價值,但是,很多AI應(yīng)用場景都屬于細(xì)分賽道,要通用芯片巨頭“削足適履”,會比較不切實際。
這些芯片巨頭當(dāng)然也會想要“染指”AI市場,但這個市場和他們過去擅長的游戲規(guī)則有落差,以前是巨頭們設(shè)計出什么樣的芯片,客戶就要乖乖接受,但AI市場是反其道而行,要透過使用者來定義產(chǎn)品,再由把需求反饋給算法,靠算法實現(xiàn)。
但是,傳統(tǒng)芯片巨頭無法緊密地直接觸碰市場需求,或是內(nèi)部沒有強大的算法團隊或數(shù)據(jù)(Data)做后援,在AI領(lǐng)域要成功,算法、數(shù)據(jù)、正確地定義市場都是關(guān)鍵。
因此,近幾年起算法公司開始切入“造芯”運動,也提供給算法公司實現(xiàn)垂直整合布局的機會,更重要的是,借由“造芯”來確保產(chǎn)品的差異化和核心價值凸顯出來。
吳耿源表示,思必馳從算法公司跨入產(chǎn)品,再垂直整合成一個平臺,上下串連系統(tǒng),在云端(Cloud)、邊緣(Edge)兩端都有布局,關(guān)鍵就是欠缺一個硬件芯片去擔(dān)任執(zhí)行的角色,而AI領(lǐng)域是軟件定義芯片,初期用市面上通用芯片時,也發(fā)現(xiàn)算法與芯片對接的過程,有很多文化融合的問題。
舉個例子,當(dāng)算法遇到芯片,發(fā)生的第一個沖突是算法的改朝換代速度遠(yuǎn)快于芯片的工藝技術(shù)。
一般而言,從定義產(chǎn)品到芯片誕生于世,大概要“懷胎”兩年(24個月),中間經(jīng)歷設(shè)計、流片、試產(chǎn)、改版、升級、量產(chǎn),每一個階段慢慢磨練,中間經(jīng)歷的循環(huán)以“季度”為單位來計算。
反觀在算法的世界里,每一個禮拜都在改,循環(huán)可能是以“禮拜”作為單位,若將算法與芯片擺在同一家企業(yè)中,彼此步伐不一致的問題,會產(chǎn)生明顯的內(nèi)部矛盾與沖突。
思必馳從算法、產(chǎn)品、平臺、系統(tǒng)整合布局到整個生態(tài)系統(tǒng),現(xiàn)在加入深聰自制AI語音芯片,布局齊全后,將跨出智能音箱這個“me too”市場,進入AIoT領(lǐng)域,包括TV盒子、白色家電、智慧家庭、故事機等,當(dāng)物聯(lián)網(wǎng)遇上AI,商機是無可限量。
多模式人機交互是理想桃花源
吳耿源進一步指出,光是語音AI技術(shù)就還有很大的精進空間,現(xiàn)在的智能音箱的溝通仍需經(jīng)過“喚醒”的程序,其實是“人工弱智”,要做到自然人機交互,當(dāng)中的技術(shù)突破就需要算法的大幅增進,其中一個關(guān)鍵的元素是聲紋。
市面上的智能音箱只能辨識出說話的內(nèi)容,再針對問題給出反饋信息,這樣的交互方式是智能化的,但交流方式卻不夠聰明,因為必須要在明確對象的情況下進行,唯有做到“聞聲即可識人”,不需要“喚醒”這個多余的動作,這才是真正的“SMART”。
吳耿源進一步解釋,AI語音芯片在應(yīng)用場景的廣度上,絕對不單是音箱領(lǐng)域,還包括物聯(lián)網(wǎng)、智慧家庭、車載市場等,更進一步場景是多模生態(tài),當(dāng)下AI是最好的時代,天時、地利、人和,AI時代正在騰飛、國家關(guān)注造芯、加上軟件、硬件、人和的融合。
現(xiàn)在的AI技術(shù)場景分別在語音、視覺兩大領(lǐng)域有不錯的起步和成功的場景落地,但卻都是各自表現(xiàn),所謂的多模生態(tài)是指聲覺、視覺、五官、手勢、觸摸等獨立的功能融合在一起,實現(xiàn)自然的多模式人機交互。
AI技術(shù)領(lǐng)域的前方是無人區(qū),只能摸著石頭過河,每一步都是挑戰(zhàn),但也處處是驚喜。
更重要的是,這是一個國內(nèi)最有機會與美國科技先驅(qū)并行的領(lǐng)域,AI技術(shù)的“造芯”運動是日正當(dāng)中,想想海思追趕高通也花了超過十年,才造就今日的江湖地位,國內(nèi)發(fā)展AI技術(shù)有應(yīng)用場景做后盾,要打造出一家巨星級的企業(yè),這一劍肯定不用磨到十年!