打破總線瓶頸,讓片內(nèi)帶寬像海洋一樣寬闊
急劇增長(zhǎng)的數(shù)據(jù)量在改變?nèi)祟惿罘绞降耐瑫r(shí),也在深刻影響著技術(shù)走勢(shì)。高速接口、5G拓寬了系統(tǒng)之間的數(shù)據(jù)通道,但系統(tǒng)內(nèi)部互連,特別是芯片內(nèi)部互連,也需要?jiǎng)?chuàng)新的方式來(lái)實(shí)現(xiàn)更高帶寬。像自動(dòng)駕駛這樣的應(yīng)用,不僅需要高帶寬,還要保證信息傳遞的實(shí)時(shí)性與有效性,即要保證極佳的信息服務(wù)質(zhì)量(QoS),“自動(dòng)駕駛商用化,是人類第一次把身家性命大規(guī)模交給半導(dǎo)體來(lái)決斷,芯片內(nèi)部互連將至關(guān)重要,設(shè)計(jì)師需要保證信號(hào)回路沒有任何阻斷,延遲滿足系統(tǒng)要求。”
NetSpeed Systems(以下簡(jiǎn)稱NetSpeed)大中華區(qū)銷售總監(jiān)黃啓弘對(duì)TechSugar表示。
將互聯(lián)網(wǎng)技術(shù)搬到芯片內(nèi)部去
支持高水平自動(dòng)駕駛功能的芯片均異常復(fù)雜,以Nvidia(英偉達(dá))為例,其首款自動(dòng)駕駛片上系統(tǒng)(SoC)Xavier集成了一個(gè)特別定制的8核CPU、一個(gè)512核Volta GPU、一個(gè)全新深度學(xué)習(xí)加速器、全新計(jì)算機(jī)視覺加速器、以及全新8K HDR視頻處理器,該芯片共集成超90億個(gè)晶體管,Nvidia投入2000多名工程師在這個(gè)項(xiàng)目上,總研發(fā)時(shí)間超過(guò)4年,總研發(fā)費(fèi)用高達(dá)20億美元。
20億美元8000個(gè)工程年,是不是自動(dòng)駕駛芯片都這樣高不可攀?當(dāng)然不是,Mobileye、特斯拉以及中國(guó)的地平線機(jī)器人等公司,都在發(fā)展自動(dòng)駕駛用SoC芯片,根據(jù)各自對(duì)自動(dòng)駕駛的理解,系統(tǒng)復(fù)雜度會(huì)有較大區(qū)別,再利用成熟的IP與工具,研發(fā)成本與時(shí)間預(yù)算與Xavier相比可能會(huì)有數(shù)量級(jí)的差異。
以特斯拉的自動(dòng)駕駛芯片為例,據(jù)黃啟弘介紹,從設(shè)計(jì)到流片只花了不到一年時(shí)間,NetSpeed相關(guān)解決方案力助特斯拉縮短研發(fā)周期,快速完成設(shè)計(jì)迭代。
當(dāng)一顆芯片集成數(shù)百甚至上千個(gè)運(yùn)算單元時(shí),內(nèi)部互連如何實(shí)現(xiàn)成為架構(gòu)工程師與設(shè)計(jì)工程師面臨的最嚴(yán)峻考驗(yàn)之一,傳統(tǒng)總線架構(gòu)已經(jīng)變成系統(tǒng)性能的主要瓶頸。總線架構(gòu)適合簡(jiǎn)單架構(gòu),但如果單芯片集成處理器核數(shù)越多,需要連接互通的模塊越多,總線架構(gòu)在性能、功耗、全局時(shí)鐘同步、信號(hào)完整性及可靠性等方面面臨的挑戰(zhàn)將呈指數(shù)型增長(zhǎng)。
NetSpeed Systems大中華區(qū)銷售總監(jiān)黃啓弘
“能否不要用總線理論,把所有數(shù)據(jù)用橋接模塊分成數(shù)據(jù)包,用互聯(lián)網(wǎng)的方法分發(fā)出去,”黃啓弘將這種片上網(wǎng)絡(luò)(NoC)理念形象地比喻成在芯片上布一個(gè)互聯(lián)網(wǎng)。
片上網(wǎng)絡(luò)采用數(shù)據(jù)路由和分組交換技術(shù)替代傳統(tǒng)總線結(jié)構(gòu),從體系結(jié)構(gòu)上解決了傳統(tǒng)總線結(jié)構(gòu)由于地址空間有限導(dǎo)致的可擴(kuò)展性差,分時(shí)通訊引起的通訊效率低下,以及全局時(shí)鐘同步引起的功耗和面積較大等問題。
與傳統(tǒng)的總線互連技術(shù)相比,NetSpeed的解決方案解除了總線架構(gòu)帶來(lái)的數(shù)據(jù)吞吐量限制,片內(nèi)帶寬可支持到萬(wàn)億字節(jié)每秒(TB/s),接口位寬高達(dá)1024位 ,并可定制更高位寬??偩€結(jié)構(gòu)需要針對(duì)不同的系統(tǒng)需求單獨(dú)進(jìn)行設(shè)計(jì),當(dāng)系統(tǒng)功能擴(kuò)展時(shí),需要對(duì)現(xiàn)有設(shè)計(jì)方案重新設(shè)計(jì),研發(fā)成本與設(shè)計(jì)周期均比較長(zhǎng),NetSpeed的解決方案采用分層堆疊方式將網(wǎng)絡(luò)架構(gòu)解耦,具有良好的可擴(kuò)展性。當(dāng)SoC片內(nèi)網(wǎng)絡(luò)中節(jié)點(diǎn)數(shù)量增加時(shí),僅需要按照相應(yīng)拓?fù)浣Y(jié)構(gòu)規(guī)則繼續(xù)增大網(wǎng)絡(luò)規(guī)模即可,縮短了產(chǎn)品的設(shè)計(jì)周期,節(jié)約了研發(fā)成本。另外,傳統(tǒng)總線架構(gòu),每次信息交互都需要驅(qū)動(dòng)全局互連線,因此總線結(jié)構(gòu)所消耗的功耗將隨SoC規(guī)模增加而顯著增加,而NetSpeed方案中,可以將一部分信號(hào)通路關(guān)掉,從而實(shí)現(xiàn)低功耗。
為什么是NetSpeed?
NetSpeed成立于2011年,到現(xiàn)在規(guī)模并不大,在半導(dǎo)體行業(yè)資歷頗深的黃啓弘為何要選擇加入NetSpeed?用他自己的話來(lái)說(shuō),就是NetSpeed顯示了增長(zhǎng)的潛力,過(guò)去幾年?duì)I業(yè)額都是100%以上的速度增長(zhǎng),也具備了成功的要素,“一家初創(chuàng)企業(yè)能否成功,主要看兩點(diǎn),第一是高管團(tuán)隊(duì),第二是時(shí)機(jī),能否在合適的時(shí)間,為市場(chǎng)上一個(gè)普遍難解的問題,提出合適的解決方案?!?
NetSpeed核心技術(shù)團(tuán)隊(duì)來(lái)自思科與華為,這是他們能夠?qū)⒑暧^世界的網(wǎng)絡(luò)拓?fù)渌枷胗成涞叫酒瑑?nèi)部的基礎(chǔ)。而人工智能應(yīng)用爆發(fā)帶來(lái)的數(shù)據(jù)洪流,讓SoC的計(jì)算單元數(shù)量暴漲,對(duì)SoC內(nèi)部帶寬需求急劇增加,這正是黃啓弘所說(shuō)的時(shí)機(jī),在這個(gè)時(shí)間點(diǎn)上,NetSpeed解決方案為眾多專注人工智能芯片設(shè)計(jì)的公司所重視,NetSpeed首席執(zhí)行官Sundari Mitra表示:“這些新SoC內(nèi)部體現(xiàn)出的是一種新的數(shù)據(jù)流,一般來(lái)說(shuō),想實(shí)現(xiàn)快速有效的點(diǎn)對(duì)點(diǎn)數(shù)據(jù)交換,就需要大量的計(jì)算單元。傳統(tǒng)架構(gòu)運(yùn)行方式不同,采用中央存儲(chǔ)作為數(shù)據(jù)交換系統(tǒng)。而人工智能系統(tǒng)需要任意位置數(shù)據(jù)交換,這可以通過(guò)廣泛的接口而實(shí)現(xiàn),并需要支持長(zhǎng)突發(fā)傳輸。Orion AI的一個(gè)關(guān)鍵優(yōu)勢(shì)就是能夠支持多重多播請(qǐng)求,并支持非阻塞傳輸。”
Orion AI由NetSpeed的圖靈機(jī)器學(xué)習(xí)引擎提供支持,該引擎使用監(jiān)督學(xué)習(xí)來(lái)探索和優(yōu)化SoC設(shè)計(jì)與架構(gòu),為優(yōu)化對(duì)自動(dòng)駕駛應(yīng)用的支持,Orion AI通過(guò)了ISO 26262標(biāo)準(zhǔn),可支持ASIL D級(jí)別安全要求。
除了這次發(fā)布的Orion AI,NetSpeed還提供其他互連和高速緩存IP,以及設(shè)計(jì)開發(fā)工具NoCStudio。利用NoCStudio,SoC 開發(fā)人員可快速、高效、可靠地生成高度定制化的解決方案,NoCStudio輸出的模塊具有無(wú)死鎖、緩存一致性以及確保服務(wù)質(zhì)量的特性。
下一步計(jì)劃
人工智能應(yīng)用在中美都是熱點(diǎn),在NetSpeed列出的四家重要客戶中,有三家是中國(guó)公司。除了自動(dòng)駕駛,在云計(jì)算、AR、VR等方面NetSpeed都有布局,NetSpeed也在與手機(jī)芯片公司展開合作。
“到了5G之后,數(shù)據(jù)量非常大,數(shù)據(jù)交換的負(fù)擔(dān)非常繁重。在NetSpeed看來(lái),這也是在一個(gè)合適的時(shí)間點(diǎn),進(jìn)入一個(gè)合適的市場(chǎng),因?yàn)橄乱淮謾C(jī)芯片的設(shè)計(jì)復(fù)雜度,一定是數(shù)量級(jí)上的飛躍,在這種情況下,工程師可能必須利用人工智能的方法,才能把設(shè)計(jì)做出來(lái),在這方面,NetSpeed有優(yōu)勢(shì)?!?
除了拓展中國(guó)市場(chǎng)及團(tuán)隊(duì),黃啓弘表示,NetSpeed還在開發(fā)芯片間互連技術(shù),以及進(jìn)一步提升現(xiàn)有產(chǎn)品的性能,他最后強(qiáng)調(diào),IP公司必須要以技術(shù)為本,NetSpeed成立8年以來(lái),已經(jīng)申請(qǐng)了130多項(xiàng)專利,技術(shù)實(shí)力逐漸得到了用戶的認(rèn)可,“作為一家正在成長(zhǎng)的IP公司,技術(shù)要有足夠的優(yōu)勢(shì),最重要是得到用戶認(rèn)可?!?