當「深度學習」不僅熱門,而且還趨近于技術成熟曲線的「沸點」時,對于另一波瞄準深度學習、視覺處理的新創(chuàng)公司如雨后春筍般出現(xiàn),也就一點都不令人驚訝了。
這次是一家稱為ThinCI(發(fā)音為‘Think-Eye’)的公司,由一位出身英特爾背景的資深工程師/架構師Dinakar Munagala創(chuàng)辦。
然而,令人驚訝的是,這家位于美國加州的新創(chuàng)公司不僅有資本雄厚、擁有技術專精的大廠支持,而且還提供了一種獨特的「大規(guī)模平行架構」,Munagala稱其為「專為視覺處理和深度學習而生「。
Munagala承諾,相較于其它深度學習/視覺處理方案,該公司目前專利申請中的芯片架構可以帶來「兩個數(shù)量級的性能提升」。
從一座車庫開始,并以有限的資金熬過6年之后,ThinCI在上個月公開亮相。該公司最近還吸引了兩家大型一線汽車供貨商成為其機構投資者,而且還有一批在技術領域聲譽顯赫的大廠成為其私人投資者。
這兩家汽車供貨商分別是DENSO InternaTIonal America, Inc.,以及Magna InternaTIonal Inc.。私人投資者包括ThinCI董事會主席和Tallwood Venture Capital的管理合伙人Dado Banatao、英特爾架構部門前執(zhí)行副總裁、總經(jīng)理Dadi Perlmutter、巴斯夫(BASF)監(jiān)事會主席和戴姆勒(Daimler)監(jiān)事會成員Jurgen Hambrecht以及其他幾位背景雄厚的資深人士。
簡單、靈活他們?yōu)槭裁赐顿YThinCI?Perlmutter認為,「在整個職業(yè)生涯中,我非常欣賞簡單和靈活性。我并不喜歡一些蠻橫粗暴的方法,但著重于研究新運算問題的瓶頸,并且經(jīng)由尋找新途徑發(fā)現(xiàn)克服瓶頸的方法。ThinCI就是這么做的?!?/p>
當其它解決方案受限于數(shù)據(jù)的移入與移出,只為了填飽「饑餓」的巨大運算引擎時,Perlmutter形容ThinCI運算是一種「專為深度學習量身打造的繪圖分析法,省去了大量不必要的內(nèi)存存取程序。」
而其最終的結(jié)果如何?「它不僅加快了指令周期,而且降低了成本和功耗,」他補充說。
Munagala說自己從六年前開始,就懷抱著開發(fā)一種新芯片架構,以滿足下一代技術(如深度學習)需求的夢想,因此毅然決然地離開英特爾。
然而,ThinCI并未透露其處理器架構細節(jié),而僅稱其為「一種革命性的繪圖串流處理器」 (Graph Streaming Pocessor)。Munagala解釋,它是指「一種大規(guī)模的平行架構,專為同時處理任務圖形的多項運算節(jié)點而設計。」
深度學習本質(zhì)上是以一組算法為基礎,透過具有多個處理層、由線性與非線性交易組成的深度繪圖,嘗試在數(shù)據(jù)中建模高層級抽象。
ThinCI架構的獨特之處似乎就在于其處理深度繪圖的方式。
Munagala解釋,「ThinCI架構利用極端平行為整個繪圖任務串流數(shù)據(jù),」取代以多個處理層透過深度繪圖連續(xù)處理數(shù)據(jù)的方式。
正如Perlmutter所說的, ThinCI處理器架構的另一個關鍵要素是可編程性「。他解釋說,許多人犯了針對特定方案進行硬件客制的錯誤,而歷史教訓是:問題是不斷變化的,而程序設計人員擁有巨大的創(chuàng)造力。Perlmutter表示,ThinCI需要的是一種「對處理器進行編程以實現(xiàn)可不斷發(fā)展新方案的方法?!?/p>
很顯然地,這正是ThinCI所提供的。Munagala指出,設計人員「在使用業(yè)界標準API的同時,也受益于獨特的編程方法。這使其簡化打造為其處理器優(yōu)化的深度網(wǎng)絡。
相較于市場上的其它處理器,Munagal以GPU為例指出,「盡管GPU已被用于深度學習(如Nvidia),但它并非為數(shù)據(jù)分析而設計的。它在視覺處理方面的效率不高,而且不僅功耗高、還需大量的內(nèi)存。」DSP的問題則是編程的效率低且復雜。
那么,硬線組件如何?也不可行!因為對固定方案來說,用于深度學習的算法變化太快。 而CPU「僅適于通用目的」,因為它的效能不佳且功耗過高。
芯片上繪圖執(zhí)行相形之下,ThinCI的視覺運算引擎獨到之處在于它提供了「芯片上繪圖執(zhí)行」(on-die graph execuTIon)。它是專為加速卷積神經(jīng)網(wǎng)絡(CNN)、深層神經(jīng)網(wǎng)絡(DNN)和其它復雜算法而設計的。更重要的是,該公司表示,來自攝影機傳感器的資料「儲存和處理都在芯片上完成,而無需DRAM存取?!?/p>
圖1:ThinCI的視覺運算引擎(VISCEN)硬件架構 來源:ThinCI
因此,Munagala認為,相較于其它的處理架構,ThinCI的視覺運算引擎可以帶來更高性能、更低功耗、可編程性以及更少內(nèi)存占用。
當然,視覺處理SoC市場已開始出現(xiàn)一些新的處理器。例如。最近被英特爾收購的Movidius就是一個很好的例子。它提供專為嵌入式市場設計的視覺處理器。
針對目前在深度學習中使用的架構,Munagala說:「就性能/體積、性能/功耗指針來說,ThinCI的解決方案更高出了13倍?!垢匾氖牵妇图軜媮碚f,我們的方案更具前瞻性,它能解決其它架構無法解決的問題?!顾瑫r還強調(diào)「簡單編程模型」的重要性。
獲一線汽車供貨商青睞從兩家大型一線供貨商投資ThinCI來看,清楚地反映了三件事:第一,汽車產(chǎn)業(yè)對視覺處理和深度學習技術的巨大需求(他們認為尚未看到全貌);其次,對于讓自動駕駛成為現(xiàn)實的堅定承諾;最后,一線廠商特別需要看到技術上的突破,讓他們有足夠的籌碼與新貴金主平起平坐地談判。
只需看看去年7月宣布成立的Mobileye/Intel/BMW聯(lián)盟。很顯然地,一線供貨商都缺席了。
「DENSO一直在研究計算機視覺處理領域的新發(fā)展,而我們對ThinCI的投資更展現(xiàn)了堅定信念,即ThinCI的技術將很快成為下一代自動駕駛系統(tǒng)的關鍵組件——未來的新系統(tǒng)需要先進的運算技術結(jié)合深度學習能力,」DENSO創(chuàng)投總監(jiān)Tony Cannestra在一份聲明中說。
Magna技術長Swamy Kotagiri也表示:「我們很高興能結(jié)合ThinCI在處理和軟件領域的強項,以及Magna對于汽車系統(tǒng)的整體理解。
在汽車市場之外ThinCI并不僅著眼于汽車市場。畢竟,汽車領域的進展一向十分緩慢,特別是考慮到在最終生產(chǎn)前必須進行的所有測試和認證。但這對在其它領域?qū)ふ医跈C會的任何新創(chuàng)公司都意味深長。
Munagala解釋,視覺處理和深度學習應用「可以應用在任何地方」,從自然用戶接口到監(jiān)控攝影機甚至白色家電。
Perlmutter同意這樣的看法?!钙囍皇巧疃葘W習的一類應用,但深度學習卻可因應大量的新問題類型。
他解釋說,「創(chuàng)造適用于所有類似人類行為的適應性方案,包括從視覺、語音,一直到巨量數(shù)據(jù)收集的優(yōu)化算法,以及復雜的BOT與輔助等。
Perlmutter認為,深度學習成效卓著,特別是「當我們從智能型手機轉(zhuǎn)移到增強實境(AR)類裝置時?!顾f,「我們與AR裝置的互動,以及需要它提供的復雜程度(在辦公室、制造廠房和旅途中),將遠遠超越當今與智能型手機互動的笨拙方式?!?/p>
值得慶幸的是,ThinCI在嵌入式市場的優(yōu)勢在于其視覺運算引擎具有很高的可擴展性。 Munagala說:「我們能因應從可穿戴式裝置到內(nèi)建通用軟件堆棧的服務器等領域的多樣化市場?!?/p>
圖2:新興應用需要新的視覺處理技術 來源:ThinCI
時間表根據(jù)ThinCI,其視覺運算引擎架構「已在2015年告一段落,其測試芯片也已經(jīng)完成驗證了。」該公司目前正籌措資金以實現(xiàn)計劃于2017年啟動的首次芯片生產(chǎn)。從今年初開始,ThinCI已經(jīng)完成其軟件工具套件的beta測試。
ThinCI的投資者對于該團隊所提供的成果也信心滿滿。巴斯夫監(jiān)事會主席和戴姆勒監(jiān)事會成員Jurgen Hambrecht表示,由于「ThinCI擁有杰出的團隊和能力」,讓他決定了個人投資。
Hambrecht更看好的是,「ThinCI將為多樣化的產(chǎn)業(yè)應用帶來突破性的硬件軟件?!?/p>