新芯片架構(gòu)瞄準(zhǔn)深度學(xué)習(xí)和視覺(jué)處理
掃描二維碼
隨時(shí)隨地手機(jī)看文章
當(dāng)「深度學(xué)習(xí)」不僅熱門,而且還趨近于技術(shù)成熟曲線的「沸點(diǎn)」時(shí),對(duì)于另一波瞄準(zhǔn)深度學(xué)習(xí)、視覺(jué)處理的新創(chuàng)公司如雨后春筍般出現(xiàn),也就一點(diǎn)都不令人驚訝了。
這次是一家稱為ThinCI(發(fā)音為‘Think-Eye’)的公司,由一位出身英特爾背景的資深工程師/架構(gòu)師Dinakar Munagala創(chuàng)辦。
然而,令人驚訝的是,這家位于美國(guó)加州的新創(chuàng)公司不僅有資本雄厚、擁有技術(shù)專精的大廠支持,而且還提供了一種獨(dú)特的「大規(guī)模平行架構(gòu)」,Munagala稱其為「專為視覺(jué)處理和深度學(xué)習(xí)而生「。
Munagala承諾,相較于其它深度學(xué)習(xí)/視覺(jué)處理方案,該公司目前專利申請(qǐng)中的芯片架構(gòu)可以帶來(lái)「兩個(gè)數(shù)量級(jí)的性能提升」。
從一座車庫(kù)開(kāi)始,并以有限的資金熬過(guò)6年之后,ThinCI在上個(gè)月公開(kāi)亮相。該公司最近還吸引了兩家大型一線汽車供貨商成為其機(jī)構(gòu)投資者,而且還有一批在技術(shù)領(lǐng)域聲譽(yù)顯赫的大廠成為其私人投資者。
這兩家汽車供貨商分別是DENSO InternaTIonal America, Inc.,以及Magna InternaTIonal Inc.。私人投資者包括ThinCI董事會(huì)主席和Tallwood Venture Capital的管理合伙人Dado Banatao、英特爾架構(gòu)部門前執(zhí)行副總裁、總經(jīng)理Dadi Perlmutter、巴斯夫(BASF)監(jiān)事會(huì)主席和戴姆勒(Daimler)監(jiān)事會(huì)成員Jurgen Hambrecht以及其他幾位背景雄厚的資深人士。
簡(jiǎn)單、靈活他們?yōu)槭裁赐顿YThinCI?Perlmutter認(rèn)為,「在整個(gè)職業(yè)生涯中,我非常欣賞簡(jiǎn)單和靈活性。我并不喜歡一些蠻橫粗暴的方法,但著重于研究新運(yùn)算問(wèn)題的瓶頸,并且經(jīng)由尋找新途徑發(fā)現(xiàn)克服瓶頸的方法。ThinCI就是這么做的。」
當(dāng)其它解決方案受限于數(shù)據(jù)的移入與移出,只為了填飽「饑餓」的巨大運(yùn)算引擎時(shí),Perlmutter形容ThinCI運(yùn)算是一種「專為深度學(xué)習(xí)量身打造的繪圖分析法,省去了大量不必要的內(nèi)存存取程序。」
而其最終的結(jié)果如何?「它不僅加快了指令周期,而且降低了成本和功耗,」他補(bǔ)充說(shuō)。
Munagala說(shuō)自己從六年前開(kāi)始,就懷抱著開(kāi)發(fā)一種新芯片架構(gòu),以滿足下一代技術(shù)(如深度學(xué)習(xí))需求的夢(mèng)想,因此毅然決然地離開(kāi)英特爾。
然而,ThinCI并未透露其處理器架構(gòu)細(xì)節(jié),而僅稱其為「一種革命性的繪圖串流處理器」 (Graph Streaming Pocessor)。Munagala解釋,它是指「一種大規(guī)模的平行架構(gòu),專為同時(shí)處理任務(wù)圖形的多項(xiàng)運(yùn)算節(jié)點(diǎn)而設(shè)計(jì)?!?/p>
深度學(xué)習(xí)本質(zhì)上是以一組算法為基礎(chǔ),透過(guò)具有多個(gè)處理層、由線性與非線性交易組成的深度繪圖,嘗試在數(shù)據(jù)中建模高層級(jí)抽象。
ThinCI架構(gòu)的獨(dú)特之處似乎就在于其處理深度繪圖的方式。
Munagala解釋,「ThinCI架構(gòu)利用極端平行為整個(gè)繪圖任務(wù)串流數(shù)據(jù),」取代以多個(gè)處理層透過(guò)深度繪圖連續(xù)處理數(shù)據(jù)的方式。
正如Perlmutter所說(shuō)的, ThinCI處理器架構(gòu)的另一個(gè)關(guān)鍵要素是可編程性「。他解釋說(shuō),許多人犯了針對(duì)特定方案進(jìn)行硬件客制的錯(cuò)誤,而歷史教訓(xùn)是:?jiǎn)栴}是不斷變化的,而程序設(shè)計(jì)人員擁有巨大的創(chuàng)造力。Perlmutter表示,ThinCI需要的是一種「對(duì)處理器進(jìn)行編程以實(shí)現(xiàn)可不斷發(fā)展新方案的方法?!?/p>
很顯然地,這正是ThinCI所提供的。Munagala指出,設(shè)計(jì)人員「在使用業(yè)界標(biāo)準(zhǔn)API的同時(shí),也受益于獨(dú)特的編程方法。這使其簡(jiǎn)化打造為其處理器優(yōu)化的深度網(wǎng)絡(luò)。
相較于市場(chǎng)上的其它處理器,Munagal以GPU為例指出,「盡管GPU已被用于深度學(xué)習(xí)(如Nvidia),但它并非為數(shù)據(jù)分析而設(shè)計(jì)的。它在視覺(jué)處理方面的效率不高,而且不僅功耗高、還需大量的內(nèi)存?!笵SP的問(wèn)題則是編程的效率低且復(fù)雜。
那么,硬線組件如何?也不可行!因?yàn)閷?duì)固定方案來(lái)說(shuō),用于深度學(xué)習(xí)的算法變化太快。 而CPU「僅適于通用目的」,因?yàn)樗男懿患亚夜倪^(guò)高。
芯片上繪圖執(zhí)行相形之下,ThinCI的視覺(jué)運(yùn)算引擎獨(dú)到之處在于它提供了「芯片上繪圖執(zhí)行」(on-die graph execuTIon)。它是專為加速卷積神經(jīng)網(wǎng)絡(luò)(CNN)、深層神經(jīng)網(wǎng)絡(luò)(DNN)和其它復(fù)雜算法而設(shè)計(jì)的。更重要的是,該公司表示,來(lái)自攝影機(jī)傳感器的資料「儲(chǔ)存和處理都在芯片上完成,而無(wú)需DRAM存取?!?/p>
圖1:ThinCI的視覺(jué)運(yùn)算引擎(VISCEN)硬件架構(gòu) 來(lái)源:ThinCI
因此,Munagala認(rèn)為,相較于其它的處理架構(gòu),ThinCI的視覺(jué)運(yùn)算引擎可以帶來(lái)更高性能、更低功耗、可編程性以及更少內(nèi)存占用。
當(dāng)然,視覺(jué)處理SoC市場(chǎng)已開(kāi)始出現(xiàn)一些新的處理器。例如。最近被英特爾收購(gòu)的Movidius就是一個(gè)很好的例子。它提供專為嵌入式市場(chǎng)設(shè)計(jì)的視覺(jué)處理器。
針對(duì)目前在深度學(xué)習(xí)中使用的架構(gòu),Munagala說(shuō):「就性能/體積、性能/功耗指針來(lái)說(shuō),ThinCI的解決方案更高出了13倍。」更重要的是,「就架構(gòu)來(lái)說(shuō),我們的方案更具前瞻性,它能解決其它架構(gòu)無(wú)法解決的問(wèn)題?!顾瑫r(shí)還強(qiáng)調(diào)「簡(jiǎn)單編程模型」的重要性。
獲一線汽車供貨商青睞從兩家大型一線供貨商投資ThinCI來(lái)看,清楚地反映了三件事:第一,汽車產(chǎn)業(yè)對(duì)視覺(jué)處理和深度學(xué)習(xí)技術(shù)的巨大需求(他們認(rèn)為尚未看到全貌);其次,對(duì)于讓自動(dòng)駕駛成為現(xiàn)實(shí)的堅(jiān)定承諾;最后,一線廠商特別需要看到技術(shù)上的突破,讓他們有足夠的籌碼與新貴金主平起平坐地談判。
只需看看去年7月宣布成立的Mobileye/Intel/BMW聯(lián)盟。很顯然地,一線供貨商都缺席了。
「DENSO一直在研究計(jì)算機(jī)視覺(jué)處理領(lǐng)域的新發(fā)展,而我們對(duì)ThinCI的投資更展現(xiàn)了堅(jiān)定信念,即ThinCI的技術(shù)將很快成為下一代自動(dòng)駕駛系統(tǒng)的關(guān)鍵組件——未來(lái)的新系統(tǒng)需要先進(jìn)的運(yùn)算技術(shù)結(jié)合深度學(xué)習(xí)能力,」DENSO創(chuàng)投總監(jiān)Tony Cannestra在一份聲明中說(shuō)。
Magna技術(shù)長(zhǎng)Swamy Kotagiri也表示:「我們很高興能結(jié)合ThinCI在處理和軟件領(lǐng)域的強(qiáng)項(xiàng),以及Magna對(duì)于汽車系統(tǒng)的整體理解。
在汽車市場(chǎng)之外ThinCI并不僅著眼于汽車市場(chǎng)。畢竟,汽車領(lǐng)域的進(jìn)展一向十分緩慢,特別是考慮到在最終生產(chǎn)前必須進(jìn)行的所有測(cè)試和認(rèn)證。但這對(duì)在其它領(lǐng)域?qū)ふ医跈C(jī)會(huì)的任何新創(chuàng)公司都意味深長(zhǎng)。
Munagala解釋,視覺(jué)處理和深度學(xué)習(xí)應(yīng)用「可以應(yīng)用在任何地方」,從自然用戶接口到監(jiān)控?cái)z影機(jī)甚至白色家電。
Perlmutter同意這樣的看法?!钙囍皇巧疃葘W(xué)習(xí)的一類應(yīng)用,但深度學(xué)習(xí)卻可因應(yīng)大量的新問(wèn)題類型。
他解釋說(shuō),「創(chuàng)造適用于所有類似人類行為的適應(yīng)性方案,包括從視覺(jué)、語(yǔ)音,一直到巨量數(shù)據(jù)收集的優(yōu)化算法,以及復(fù)雜的BOT與輔助等。
Perlmutter認(rèn)為,深度學(xué)習(xí)成效卓著,特別是「當(dāng)我們從智能型手機(jī)轉(zhuǎn)移到增強(qiáng)實(shí)境(AR)類裝置時(shí)?!顾f(shuō),「我們與AR裝置的互動(dòng),以及需要它提供的復(fù)雜程度(在辦公室、制造廠房和旅途中),將遠(yuǎn)遠(yuǎn)超越當(dāng)今與智能型手機(jī)互動(dòng)的笨拙方式?!?/p>
值得慶幸的是,ThinCI在嵌入式市場(chǎng)的優(yōu)勢(shì)在于其視覺(jué)運(yùn)算引擎具有很高的可擴(kuò)展性。 Munagala說(shuō):「我們能因應(yīng)從可穿戴式裝置到內(nèi)建通用軟件堆棧的服務(wù)器等領(lǐng)域的多樣化市場(chǎng)?!?/p>
圖2:新興應(yīng)用需要新的視覺(jué)處理技術(shù) 來(lái)源:ThinCI
時(shí)間表根據(jù)ThinCI,其視覺(jué)運(yùn)算引擎架構(gòu)「已在2015年告一段落,其測(cè)試芯片也已經(jīng)完成驗(yàn)證了?!乖摴灸壳罢I措資金以實(shí)現(xiàn)計(jì)劃于2017年啟動(dòng)的首次芯片生產(chǎn)。從今年初開(kāi)始,ThinCI已經(jīng)完成其軟件工具套件的beta測(cè)試。
ThinCI的投資者對(duì)于該團(tuán)隊(duì)所提供的成果也信心滿滿。巴斯夫監(jiān)事會(huì)主席和戴姆勒監(jiān)事會(huì)成員Jurgen Hambrecht表示,由于「ThinCI擁有杰出的團(tuán)隊(duì)和能力」,讓他決定了個(gè)人投資。
Hambrecht更看好的是,「ThinCI將為多樣化的產(chǎn)業(yè)應(yīng)用帶來(lái)突破性的硬件軟件。」