這家創(chuàng)業(yè)公司厲害了!做的AI芯片號(hào)稱超越英偉達(dá)?
新一輪的AI熱潮讓一批創(chuàng)業(yè)者努力為自己貼上AI標(biāo)簽以便搭上這一波熱潮的紅利,當(dāng)然也有一批創(chuàng)業(yè)者在AI熱潮到來之前就早有準(zhǔn)備。AI芯片就是許多早有準(zhǔn)備的創(chuàng)業(yè)者看好的創(chuàng)業(yè)方向,他們想要為AI語音或視覺提供更好的芯片,從目前的情況看,AI視覺芯片領(lǐng)域的競爭相對激烈。值得注意的是,由AMD前芯片研發(fā)總監(jiān)帶領(lǐng)的團(tuán)隊(duì)用時(shí)兩年多研發(fā)了一款聲稱超越Intel Movidius MyriadX和Nvidia Tegra X2的AI視覺芯片,事實(shí)果真如此?
世界第一的AI視覺芯片來自初創(chuàng)公司
伴隨AI的熱潮,全球范圍內(nèi)無論是傳統(tǒng)芯片巨頭、科技企業(yè)還是初創(chuàng)公司都對AI芯片有非常高的熱情。Intel在2016年收購了硅谷初創(chuàng)視覺處理公司Movidius增強(qiáng)了其在視覺芯片領(lǐng)域的實(shí)力,Nvidia也有圖像性能強(qiáng)大的Tegra移動(dòng)處理器。國內(nèi),地平線機(jī)器人、NextVPU、耐能、云天勵(lì)飛、寒武紀(jì)科技等都是AI視覺芯片創(chuàng)業(yè)公司的代表。
越來越多公司的加入也讓AI視覺處理器市場的競爭變得越來越激烈,NextVPU(肇觀電子)CEO馮歆鵬表示:“AI視覺處理器是一個(gè)正在興起的市場,無論是對巨頭還是創(chuàng)業(yè)企業(yè)都非常重要。我們判斷視覺處理器的市場規(guī)模未來一定會(huì)超過CPU市場。”
NextVPU(肇觀電子)CEO馮歆鵬
他同時(shí)表示:“目前的時(shí)間點(diǎn)比較有意思,市場的需求已經(jīng)起來,但芯片處理AI視覺需求的時(shí)候速度慢且開發(fā)痛苦,價(jià)格也很昂貴。如今這個(gè)市場還是比較藍(lán)海的情況,英特爾和英偉達(dá)這樣的芯片巨頭在往前走,但是他們的進(jìn)展相對慢一些,因?yàn)樾屡d的市場規(guī)模還比較小,大公司往往是做大市場服務(wù)大客戶,新興市場難以撐起大公司的整個(gè)項(xiàng)目。從歷史的經(jīng)驗(yàn)看,這種科技變革的節(jié)點(diǎn)小公司更有優(yōu)勢。在AI視覺處理器領(lǐng)域,可以說目前我們微微領(lǐng)先。”
馮歆鵬口中微微領(lǐng)先的AI視覺芯片就是被稱為世界第一的AI視覺處理器NextVPU N171,這個(gè)第一如何理解?馮歆鵬表示,在端側(cè),我們的AI視覺處理器的幾何引擎每秒能計(jì)算2.48億個(gè)3D點(diǎn),這個(gè)結(jié)果把目前世界領(lǐng)先的的水平推進(jìn)了一大步。另外,N171的CNN引擎跑深度神經(jīng)網(wǎng)絡(luò)例如ResNet的結(jié)果也比Nvidia Tegra X2高好幾倍。每秒3D點(diǎn)云的性能也比Intel Movidius Myriad2、Nvidia Tegra X2高幾倍,還支持其它AI視覺處理器不支持的像素級理解和語義分割。
NextVPU N71對比Intel Movidius Myriad2/MyriadX/Nvidia Tegra X2
這家推出被稱為世界第一AI視覺處理器的公司是創(chuàng)立于2016年5月的NextVPU,不過NextVPU創(chuàng)立之初首先推出的是輔助盲人感知世界和出行的智能眼鏡,原因從馮歆鵬創(chuàng)業(yè)的歷程就能找到。馮歆鵬在創(chuàng)業(yè)前擔(dān)任AMD的研發(fā)總監(jiān),與創(chuàng)業(yè)搭檔周驥博士在大概2012年的時(shí)候就開始關(guān)注計(jì)算機(jī)視覺的方向,到了2016年他們覺得很多機(jī)會(huì)都已經(jīng)出現(xiàn),不能再繼續(xù)等下去,最后兩人就在2016年創(chuàng)立了NextVPU(Next Vision Processing Unit, 未來的視覺處理器),中文名為肇觀(有開啟視覺的含義),馮歆鵬擔(dān)任CEO,周驥擔(dān)任CTO。雖然從創(chuàng)業(yè)之初就準(zhǔn)備做芯片,但他們覺得2016年整個(gè)行業(yè)還沒起來,單一的環(huán)節(jié)做得好沒什么用,因此不得不先做一個(gè)產(chǎn)品。當(dāng)然,從他們創(chuàng)業(yè)的第一天開始就在為芯片做準(zhǔn)備,也就后來N171里的核心自研IP。
為何能開發(fā)出超越芯片巨頭的AI芯片?
從數(shù)據(jù)上看,NextVPU N171可以被稱為世界第一的AI視覺芯片,不過更讓人關(guān)注的是初創(chuàng)公司為何能打造出超越芯片巨頭的終端AI視覺芯片?這需要從NextVPU N171芯片的定位到功能去理解,創(chuàng)業(yè)之前馮歆鵬就已經(jīng)明確了要做一款A(yù)I視覺芯片,但AI芯片可以分為云端和終端芯片,不同的選擇將面對不同的市場競爭。馮歆鵬表示,云端和終端都有很多機(jī)會(huì),從英特爾的收入分布看終端和服務(wù)器芯片的收入比約為5:1,其中服務(wù)器芯片出貨量少、單價(jià)高利潤率也比較高,但是這一市場競爭非常激烈,幾乎是巨頭壟斷,更適合較大的企業(yè)。終端芯片無論是市場總量還是芯片需求量都遠(yuǎn)大于服務(wù)器市場,并且終端市場更具多樣性,用戶的需求也有一定的差別,小公司進(jìn)入和發(fā)展都比較有利。
NextVPU N171
選擇了終端市場之后,接下來需要定義產(chǎn)品功能。馮歆鵬指出,計(jì)算機(jī)視覺面臨幾何和理解兩大挑戰(zhàn),當(dāng)然,無論是幾何還是理解都有大量的需求,比如客戶想通過3D環(huán)境掃描做一個(gè)模型構(gòu)建地圖,或者生產(chǎn)線上不同的零件區(qū)分,這就需要VSLAM、多目、結(jié)構(gòu)光、TOF等技術(shù),也需要CNN識(shí)別,檢測和分割等技術(shù)??吹竭@些需求并且了解到如今的芯片不能滿足需求之后,我們芯片的功能大概就確定了。
因此,NextVPU N171具備的一大特色就是集成了三個(gè)自主IP:幾何引擎、深度神經(jīng)網(wǎng)絡(luò)引擎(CNN)、圖像成像引擎(ISP)。幾何引擎用于同時(shí)處理傳感器獲得的數(shù)據(jù)、坐標(biāo)空間信息、時(shí)間等多輸入的信息,也就是對三維點(diǎn)組成的點(diǎn)云做各種計(jì)算,這是所有VSLAM三維重建的基礎(chǔ),機(jī)器人、汽車、AR和VR領(lǐng)域等對此都有急迫的需求。據(jù)悉,N171幾何引擎每秒能處理2.48億個(gè)3D點(diǎn),處于業(yè)界領(lǐng)先的水平。
深度神經(jīng)網(wǎng)絡(luò)引擎支持圖像的檢測識(shí)別、分割以及各種主流的CNN算法。模型從簡單到復(fù)雜,邏輯從幾層到幾百層都支持。馮歆鵬強(qiáng)調(diào),深度神經(jīng)網(wǎng)絡(luò)引擎我們花了很長時(shí)間去做,并且跑越復(fù)雜的模型我們的深度神經(jīng)網(wǎng)絡(luò)引擎的利用率越高,越流行的網(wǎng)絡(luò)模型,利用率也越高,幾乎可以達(dá)到理論極限。
視覺成像引擎則是對圖像進(jìn)行處理,為了能夠讓機(jī)器看懂世界,視覺成像引擎做了非常多特殊的處理的調(diào)教,動(dòng)態(tài)范圍可以做到150dB,這是基于機(jī)器視覺的需求所決定。
除了三大自主IP,N171還有一大特色就是可獨(dú)立運(yùn)行操作系統(tǒng),這個(gè)功能是通過N171中的多核CPU來實(shí)現(xiàn)。對于這個(gè)功能,馮歆鵬表示許多用戶習(xí)慣于用像Linux這樣的操作系統(tǒng)做文件的存儲(chǔ)和調(diào)取,然后做日志,而非使用特殊的輕量級內(nèi)核。要實(shí)現(xiàn)這個(gè)功能,有兩種方式,一種是分布式的做法,在常用應(yīng)用處理器AP芯片的基礎(chǔ)上增加一個(gè)AI協(xié)處理器,第二種方式是異構(gòu)融合,也就是將兩個(gè)芯片做集成。
“我們接觸到的所有客戶都傾向于第二種方式,所以我們集成了多核CPU能夠運(yùn)行操作系統(tǒng),讓我們的芯片既能滿足傳統(tǒng)需求,也有很好地AI性能。另外,集成度越高,芯片內(nèi)部的數(shù)據(jù)傳輸及交換的成本也能越低。”馮歆鵬補(bǔ)充表示。
由此不難看出,發(fā)現(xiàn)市場的痛點(diǎn)和需求之后,根據(jù)客戶的需求一步步明確產(chǎn)品的形態(tài)和功能打造滿足市場需求的產(chǎn)品,通過自研的IP,以ASIC芯片的形式實(shí)現(xiàn),N171最終獲得比傳統(tǒng)芯片巨頭性能更強(qiáng)的芯片自然也就可以理解。不過,對市場需求的正確判斷以及好的產(chǎn)品理念還不足以讓一款芯片成功流片,背后的團(tuán)隊(duì)也非常關(guān)鍵。
馮歆鵬和周驥都來自AMD,我們知道AMD是提供CPU,也能提供GPU的高性能計(jì)算芯片公司,而AI需要的就是高性能芯片,因此從Intel、Nvidia、AMD這三家高性能計(jì)算芯片公司出來的團(tuán)隊(duì)在做AI芯片的時(shí)候在經(jīng)驗(yàn)上更具優(yōu)勢。馮歆鵬參與過50多款CPU和GPU的設(shè)計(jì),對于高性能計(jì)算芯片里的流水線設(shè)計(jì)、數(shù)據(jù)的分布式存儲(chǔ)處理等都非常有經(jīng)驗(yàn)。除了基于已有的經(jīng)驗(yàn)積累用兩年多的時(shí)間先做IP然后做SoC,N171在其他方面也有巨大的投入。
能否成功落地?
在設(shè)計(jì)、功能都能夠滿足市場需求之后,芯片的實(shí)際性能成為考驗(yàn)一款芯片能否成功落地的關(guān)鍵。對于N171這樣的高性能芯片,無法回避的問題就是高性能帶來的高功耗。馮歆鵬表示:“一款芯片的設(shè)計(jì)只要遵循規(guī)則不出錯(cuò),性能和功耗的實(shí)際值和理論值基本會(huì)遵循一條曲線。我們產(chǎn)品的性能和功耗水平同樣基于客戶的需求,根據(jù)客戶產(chǎn)品設(shè)計(jì)的電池容量以及他們期望的續(xù)航時(shí)間,可以推導(dǎo)出芯片功耗的具體水平,只要功耗不大到一定的程度客戶都能夠接受。當(dāng)然N171的性能和功耗也可以調(diào)教,不同的時(shí)鐘頻率對應(yīng)不同的功耗,也可以根據(jù)客戶的需求進(jìn)行配置。“
N171雖然是高性能芯片,但并沒有采用最先進(jìn)的7nm工藝,而是選擇了28nm工藝,這主要是從市場的角度出發(fā),使用成熟的28nm工藝的性能和功耗就能夠滿足這款芯片目標(biāo)市場和客戶的需求。
而在N171芯片的目標(biāo)市場之中,汽車市場對于芯片的穩(wěn)定性、實(shí)時(shí)性、安全性都有更高的要求。為了進(jìn)入這一市場,馮歆鵬表示:“我們的芯片首先滿足ISO TS16949、AEC-Q100兩個(gè)車規(guī)標(biāo)準(zhǔn),也正在做ISO26262標(biāo)準(zhǔn)。另外,汽車市場比消費(fèi)市場和工業(yè)市場有一些差異化的需求,比如需要支持零下40度到零上125度的溫度,還要求芯片在出現(xiàn)錯(cuò)誤之后能夠自己恢復(fù)和校準(zhǔn)。因此我們用更好的封裝材料保證其穩(wěn)定性、測試的流程也更加復(fù)雜?;谥霸O(shè)計(jì)波音飛機(jī)上使用的CPU的經(jīng)驗(yàn),我們對這些都很有經(jīng)驗(yàn),只是需要付出更多的時(shí)間和成本。”
至于火熱的安防市場,他們A輪的領(lǐng)投方是中電海康基金,這個(gè)基金背后是中電科技集團(tuán)和中電海康集團(tuán)。中電??导瘓F(tuán)下屬的??低暿菄鴥?nèi)安防領(lǐng)域的龍頭,他們在積極布局智能攝像頭,NextVPU N171里的很多設(shè)計(jì)和功能也是為安防考慮。
既然基于相同晶圓和裸片的N171能夠滿足汽車和工業(yè)市場的需求,那么消費(fèi)級市場當(dāng)然也是NextVPU不會(huì)錯(cuò)過的。據(jù)悉,N171的第一代芯片已經(jīng)成功流片,測試的結(jié)果也非常好,現(xiàn)在正處于客戶導(dǎo)入的階段,距離正式的上市還有幾個(gè)月時(shí)間。馮歆鵬透露目前的合作客戶已經(jīng)涵蓋車載、安防和機(jī)器人,希望未來N171還能做第二代、第三代,持續(xù)做下去。
在AI的熱潮下,許多有經(jīng)驗(yàn)有實(shí)力敏銳的大咖都開始了創(chuàng)業(yè),他們希望能夠在新的浪潮里發(fā)揮更大的價(jià)值,很顯然NextVPU的團(tuán)隊(duì)就屬于這一的創(chuàng)業(yè)團(tuán)隊(duì)。在技術(shù)、產(chǎn)品都能夠比肩芯片巨頭的情況下,芯片的實(shí)際落地更考驗(yàn)創(chuàng)業(yè)團(tuán)隊(duì),在這個(gè)過程中會(huì)遇到很多意想不到的事情。相信我們都愿意看到NextVPU的產(chǎn)品能夠不斷迭代,為計(jì)算機(jī)視覺領(lǐng)域帶來更好的AI芯片,也能夠增強(qiáng)中國芯片的實(shí)力。