當(dāng)前位置:首頁(yè) > EDA > 電子設(shè)計(jì)自動(dòng)化
[導(dǎo)讀] 由于電子設(shè)計(jì)日漸復(fù)雜,設(shè)計(jì)人員通常需要采用各種不同類型的功能,但他們無(wú)法具備所有的專業(yè)知識(shí)、資源和時(shí)間。這促使了半導(dǎo)體知識(shí)產(chǎn)權(quán)(SIP)市場(chǎng)的增長(zhǎng),預(yù)計(jì)2017年將達(dá)到57億美元。某些復(fù)雜設(shè)計(jì)使用的各種SIP模塊甚

 由于電子設(shè)計(jì)日漸復(fù)雜,設(shè)計(jì)人員通常需要采用各種不同類型的功能,但他們無(wú)法具備所有的專業(yè)知識(shí)、資源和時(shí)間。這促使了半導(dǎo)體知識(shí)產(chǎn)權(quán)(SIP)市場(chǎng)的增長(zhǎng),預(yù)計(jì)2017年將達(dá)到57億美元。某些復(fù)雜設(shè)計(jì)使用的各種SIP模塊甚至多達(dá)100多種。因此,需要解決如何將這些模塊集成到設(shè)計(jì)中,并驗(yàn)證它們能夠在底層硬件上很好地工作。在每一新工藝代上,這都變得越來(lái)越困難。

而且,當(dāng)使用來(lái)自不同供應(yīng)商的SIP模塊時(shí),由于沒有標(biāo)準(zhǔn)指導(dǎo)如何編寫這些模塊,或在不同設(shè)計(jì)中如何使用它們,因此,互操作性問題也越來(lái)越復(fù)雜。每一個(gè)模塊對(duì)速度、功耗、管芯尺寸等方面都有不同的要求,芯片系統(tǒng)(SOC)設(shè)計(jì)人員無(wú)法切實(shí)有效地滿足所有需求。因此,使用多家供應(yīng)商的IP模塊實(shí)現(xiàn)最優(yōu)設(shè)計(jì)頗具挑戰(zhàn)。

此外,如果業(yè)界仍然按照過(guò)去十年的發(fā)展軌跡繼續(xù)走下去,實(shí)現(xiàn)一個(gè)每秒400吉比特(Gbps)的系統(tǒng)幾乎要完全占用1百萬(wàn)邏輯單元(LE)的整片FPGA。這肯定不會(huì)被客戶接納。Altera已認(rèn)識(shí)到這一點(diǎn),從頭開始重新規(guī)劃了高性能IP,不僅速度更快以支持越來(lái)越高的數(shù)據(jù)速率,而且還提供更小、更高效的IP。采用創(chuàng)新的體系結(jié)構(gòu),IP模塊比以前的產(chǎn)品快兩倍,體積小50%。

對(duì)速度的需求

互聯(lián)網(wǎng)的爆炸式增長(zhǎng)使得高速數(shù)據(jù)處理成為一項(xiàng)關(guān)鍵功能。據(jù)國(guó)際電信聯(lián)盟(ITU),2011年,世界70億人口中有三分之一使用互聯(lián)網(wǎng),產(chǎn)生的網(wǎng)絡(luò)流量高達(dá)每秒80太比特(Tbps),比上一年增長(zhǎng)45%。

下一波互聯(lián)網(wǎng)應(yīng)用是機(jī)器至機(jī)器(M2M)通信,即物聯(lián)網(wǎng)(IoT)。IoT涉及多種設(shè)備,如智能儀表、無(wú)線傳感器節(jié)點(diǎn)、工業(yè)監(jiān)視控制和數(shù)據(jù)采集(SCADA)系統(tǒng)、網(wǎng)關(guān),以及高速收費(fèi)標(biāo)簽讀卡器等。所有這些都會(huì)在公共和私有基礎(chǔ)設(shè)施上產(chǎn)生大量的數(shù)據(jù)流。IoT市場(chǎng)在2011年達(dá)到440億美元,預(yù)計(jì)每年增長(zhǎng)30%,2017年會(huì)達(dá)到2900億美元。

另一個(gè)增長(zhǎng)迅速的領(lǐng)域是移動(dòng)通信。2011年IP數(shù)據(jù)流的55%來(lái)自移動(dòng)通信——每年的增長(zhǎng)率達(dá)到66%。這對(duì)于電信公司而言是巨大的挑戰(zhàn),他們目前正盡快部署4G網(wǎng)絡(luò)?;驹絹?lái)越多地依靠高速FPGA來(lái)提高內(nèi)核性能,在很寬的頻率范圍內(nèi)處理復(fù)雜的功能。FPGA能夠靈活地適應(yīng)不斷變化發(fā)展的標(biāo)準(zhǔn),有助于保護(hù)在4G基站上的投入。

據(jù)思科公司,互聯(lián)網(wǎng)協(xié)議數(shù)據(jù)流在2016年底每年會(huì)超過(guò)萬(wàn)億字節(jié)(1021)。

數(shù)據(jù)中心尤其要面對(duì)很大的壓力來(lái)處理越來(lái)越大的數(shù)據(jù)流。多核處理器這種發(fā)展趨勢(shì)雖然解決了功耗問題,但外部存儲(chǔ)器和數(shù)據(jù)帶寬卻跟不上計(jì)算能力的增長(zhǎng)。這種情況非常適合采用FPGA進(jìn)行數(shù)據(jù)訪問、計(jì)算和網(wǎng)絡(luò)加速,解決數(shù)據(jù)訪問瓶頸問題。隨著云計(jì)算和軟件即服務(wù)(SaaS)的不斷發(fā)展,這將會(huì)越來(lái)越重要。

下一代FPGA將采用高速串行存儲(chǔ)器克服并行存儲(chǔ)器接口的帶寬、延時(shí)和功耗局限。Arria 10 FPGA能夠很輕松地處理100 Gbps和200 Gbps數(shù)據(jù)流。具有多個(gè)56 Gbps收發(fā)器的Stratix 10 FPGA可以處理400 Gbps以太網(wǎng)(GbE)和500 Gbps Interlaken數(shù)據(jù)流。

全面的Altera IP

FPGA雖然能解決4G基站和數(shù)據(jù)中心通道卡的存儲(chǔ)器和I/O接口瓶頸問題,但數(shù)據(jù)通路帶寬和頻率的增長(zhǎng)通常也使功耗直線上升。這是Altera在全系列IP內(nèi)核上綜合考慮的關(guān)鍵問題,以及帶寬和管芯尺寸。

對(duì)任何應(yīng)用而言,存儲(chǔ)器訪問都非常關(guān)鍵。Altera FPGA具有豐富的片內(nèi)SRAM存儲(chǔ)器,而對(duì)于需要快速訪問片外存儲(chǔ)器的應(yīng)用,Altera及其合作伙伴提供存儲(chǔ)器控制器IP內(nèi)核、參考設(shè)計(jì)和設(shè)計(jì)實(shí)例。所有這些都經(jīng)過(guò)了硬件測(cè)試的置入式設(shè)計(jì)模塊,能夠大大簡(jiǎn)化復(fù)雜存儲(chǔ)器的本地接口。支持的標(biāo)準(zhǔn)包括:

●SDR SDRAM

●RLDRAM 2或者RLDRAM 3

●DDR SDRAM

●DDR2 SDRAM

●DDR3 SDRAM

●DDR4 SDRAM

存儲(chǔ)器技術(shù)發(fā)展非???,Altera始終都在追蹤最新變化。Micron的3-D混合立方存儲(chǔ)器(HMC)的帶寬是DDR3 SDRAM模塊的15倍,能耗比現(xiàn)有技術(shù)低70%,占用的電路板空間減少了90%。Altera和Micron最近展示了Altera 28 nm Stratix V FPGA和Micron HMC的互操作性。今后的Arria 10和Stratix 10 FPGA都將包括HMC接口。

對(duì)于芯片至芯片、電路板至電路板,以及機(jī)框至機(jī)框連接,Altera及其合作伙伴提供175種不同的互聯(lián)IP內(nèi)核和參考設(shè)計(jì),采用了集成到FPGA和ASIC器件中的收發(fā)器,僅以太網(wǎng)IP內(nèi)核就能提供60種解決方案。以許可IP內(nèi)核和參考設(shè)計(jì)以及免費(fèi)宏功能和設(shè)計(jì)實(shí)例的形式提供這些接口協(xié)議。

PCI Express (PCIe)是數(shù)據(jù)中心所采用的主要背板互聯(lián)標(biāo)準(zhǔn)。Altera通過(guò)其Cyclone、Arria和Stratix FPGA產(chǎn)品線來(lái)提供PCIe Gen1 (2.5 Gbps)和Gen2 (5.0 Gbps) IP。Stratix V FPGA包含PCIe Gen3 (8.0 Gbps),以硬核IP模塊的形式嵌入?yún)f(xié)議棧。PCIe標(biāo)準(zhǔn)一直是10代FPGA關(guān)注的重點(diǎn)。硬核實(shí)現(xiàn)了PCIe模塊后,每一IP例化的資源節(jié)省了8,000至30,000個(gè)LE,與功能等價(jià)的軟核IP相比,時(shí)序收斂更快,設(shè)計(jì)和編譯時(shí)間更短,而且有效地降低了功耗。所有PCIe內(nèi)核都經(jīng)過(guò)驗(yàn)證,符合相應(yīng)的PCI Express基本規(guī)范。

更小、更快、更好

Altera新的低延時(shí)10GbE IP內(nèi)核最先受益于10代FPGA體系結(jié)構(gòu)。IP優(yōu)化將內(nèi)核性能從156.25 MHz提高到312.5 MHz。表2對(duì)比了現(xiàn)有標(biāo)準(zhǔn)10GbE IP內(nèi)核與新的低延時(shí)內(nèi)核。不但體積減小36%,速度提高24%,而且低延時(shí)40GbE IP內(nèi)核在體積和延時(shí)方面的優(yōu)勢(shì)是減小了40%,而低延時(shí)100GbE IP內(nèi)核打破了傳統(tǒng)的思路,引腳布局減小了55%,往返延時(shí)降低了70%。與已經(jīng)非常優(yōu)秀的內(nèi)核和真正同類最佳的IP相比,這些IP均更為先進(jìn)。

表1列出了標(biāo)準(zhǔn)和低延時(shí)10GbE IP內(nèi)核在大小和速度上的不同。

表1.10GbE內(nèi)核大小和速度

表2列出了標(biāo)準(zhǔn)和低延時(shí)40GbE IP內(nèi)核在大小和速度上的不同。

表2.40GbE IP內(nèi)核大小和速度

表3列出了標(biāo)準(zhǔn)和低延時(shí)100GbE IP內(nèi)核在大小和速度上的不同。

表3.100GbE IP內(nèi)核大小和速度

Interlaken是可擴(kuò)展協(xié)議,支持從10 Gbps到100 Gbps及以上的芯片至芯片數(shù)據(jù)包傳送。Interlaken設(shè)計(jì)用于接入、骨干以太網(wǎng)和數(shù)據(jù)中心應(yīng)用的多太比特路由器和交換機(jī),這些應(yīng)用要求IP可配置,以優(yōu)化系統(tǒng)性能和互操作性。Altera的Interlaken IP內(nèi)核使用了Stratix V和Arria V FPGA中的硬核PCS,與軟核IP相比,節(jié)省了30%至50%的邏輯資源。Altera的IP內(nèi)核經(jīng)過(guò)了大量的仿真驗(yàn)證,確保了符合Interlaken協(xié)議規(guī)范v1.2。表4總結(jié)了Altera Interlaken IP的特性和優(yōu)點(diǎn):

表4.Altera Interlaken IP的特性和優(yōu)點(diǎn)

目前低延時(shí)10GbE IP內(nèi)核已開始提供,并可早期試用Interlaken和40GbE以及100GbE IP內(nèi)核,預(yù)計(jì)2014年上半年開始批量供貨。

設(shè)計(jì)人員可以從數(shù)百個(gè)Altera IP解決方案中進(jìn)行選擇,所有這些IP都經(jīng)過(guò)了全面的測(cè)試、驗(yàn)證和優(yōu)化,能夠在底層硬件上工作,從而避免了棘手的集成問題,支持圍繞復(fù)雜的IP模塊開發(fā)應(yīng)用程序,并確保能夠協(xié)同工作,因此,產(chǎn)品能夠更迅速面市。

隨著數(shù)據(jù)速率的不斷提高,100 Gbps帶寬會(huì)很快耗盡,新的400 Gbps系統(tǒng)高速協(xié)議將是現(xiàn)有硬件面臨的一個(gè)主要難題。10代FPGA體系結(jié)構(gòu)不斷創(chuàng)新,Altera可交付1 GHz FPGA,極大的提高了帶寬,同時(shí)切實(shí)降低了功耗,減小了管芯尺寸。Stratix 10 FPGA將能夠處理400GbE,甚至500 Gbps Interlaken。

綜合考慮進(jìn)行設(shè)計(jì)

那么Altera是如何針對(duì)這么多的IP內(nèi)核快速實(shí)現(xiàn)如此低的延時(shí),并減小尺寸的?答案在于IP體系結(jié)構(gòu)以及底層FPGA硅片的體系結(jié)構(gòu)。事實(shí)上,二者相結(jié)合才實(shí)現(xiàn)了電路板上的這些重大改進(jìn)。對(duì)于底層硅片,通常認(rèn)為芯片設(shè)計(jì)不可避免的會(huì)有困難,在速度、功耗、延時(shí)和管芯尺寸上要進(jìn)行難以取舍的綜合考慮。從28 nm開始,Altera重新設(shè)計(jì)了FPGA,與前一代FPGA相比,生產(chǎn)的芯片速度更快,功耗更低,體積更小,設(shè)計(jì)人員工作起來(lái)比以前更自由。

中端Arria 10 FPGA和SoC是10代系列產(chǎn)品中推出的第一款系列器件。該系列器件為中端可編程器件設(shè)立了新標(biāo)桿,以最低的中端器件功耗實(shí)現(xiàn)了當(dāng)前高端FPGA的性能和功能。利用針對(duì)TSMC 20 nm工藝進(jìn)行了優(yōu)化的增強(qiáng)體系結(jié)構(gòu),Arria 10 FPGA和SoC比前一器件系列的性能更強(qiáng),而功耗降低了40%。

Arria 10器件的特性和功能比目前的高端FPGA更豐富,而性能提高了15%。Arria 10 FPGA和SoC反映了硅片融合的發(fā)展趨勢(shì),實(shí)現(xiàn)了系統(tǒng)集成度最高的中端器件,包括115萬(wàn)LE、集成硬核IP和第二代處理器系統(tǒng),這一系統(tǒng)具有1.5 GHz雙核ARM Cortex-A9處理器。Arria 10 FPGA和SoC含有28 Gbps收發(fā)器,帶寬比當(dāng)前一代產(chǎn)品高4倍,系統(tǒng)性能提高了3倍,支持每秒2,666兆比特(Mbps) DDR4 SDRAM以及15 Gbps HMC。

高端Stratix 10 FPGA和SoC——內(nèi)核性能高達(dá)1 GHz,將超過(guò)10 TeraFLOPS,這一性能水平是任何貨架器件都不具備的。

對(duì)于在這些硅片平臺(tái)上重新設(shè)計(jì)的IP,Altera工程師重新研究了數(shù)據(jù)通路,減少了流水線,非常關(guān)注優(yōu)化控制結(jié)構(gòu)。這樣,他們將時(shí)鐘速率提高了一倍,而延時(shí)沒有變化。

Altera邏輯單元注意到在傳統(tǒng)的流水線中,在寄存器級(jí)之間通常有三個(gè)甚至更多的LUT?,F(xiàn)有的硬件體系結(jié)構(gòu)有太多的寄存器,如果不增加后布局布線面積就無(wú)法提高寄存能力(請(qǐng)參考圖1)。

圖1.Altera邏輯單元,每一個(gè)未寄存的LUT靠近一個(gè)未使用的寄存器。

將未寄存的LUT與寄存器相匹配導(dǎo)致電路帶寬加倍,同時(shí)保持了面積不變。例如,100GbE能夠運(yùn)行在200 Gbps。應(yīng)用工程師現(xiàn)在可以選擇運(yùn)行兩個(gè)獨(dú)立的流,也可以占用一半的電路來(lái)運(yùn)行一個(gè)流(請(qǐng)參考圖2)。

圖2.未寄存LUT與未使用的寄存器相匹配

最后的選擇涉及到刪除一半的寬度,保持最初的帶寬。對(duì)于并行度很高的電路,這是停止點(diǎn):時(shí)鐘速率加倍,相同的延時(shí),一半的面積(請(qǐng)參考圖3)。

圖3.提高了效率,限制帶寬能夠減小管芯面積。

所有這些體系結(jié)構(gòu)創(chuàng)新都應(yīng)用到了Stratix V、Arria 10以及Stratix 10 FPGA和SoC上。這就是前面列出的所有IP變小、更快、更好的主要原因。這些發(fā)現(xiàn)促使Altera在將要發(fā)布的所有新IP內(nèi)核中實(shí)現(xiàn)Altera這些良好的實(shí)踐。已經(jīng)更新了Altera的設(shè)計(jì)軟件,確保全面的器件支持,實(shí)現(xiàn)與已有設(shè)計(jì)的無(wú)縫移植。

結(jié)論

Altera 10代FPGA可實(shí)現(xiàn)提高系統(tǒng)總吞吐量,降低延時(shí),同時(shí)減小功耗。電路設(shè)計(jì)人員能夠從多種10代Arria和Stratix FPGA中進(jìn)行選擇,這些器件在帶寬、延時(shí)、功耗和管芯大小方面各有側(cè)重。但是,對(duì)于任何應(yīng)用,其性能要遠(yuǎn)遠(yuǎn)超出目前所遇到的應(yīng)用,能夠很好的滿足各種設(shè)計(jì)需求。

使用Altera全系列同類最佳的IP,如10代FPGA,設(shè)計(jì)人員能夠盡快向市場(chǎng)推出最前沿的產(chǎn)品,在今后多年中都能保持領(lǐng)先地位。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉